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Richard Bird 教 授 的 文字 以 清晰 和 严谨 著称 ， 他 为 初学 函数 式 程序 设计 的 学 生 所 著 的 这 本 新 教材 ， 
调 利用 数学 思维 进行 推理 的 基本 方法 。 在 解决 问题 时 ， 首 先 从 显而易见 的 简单 方法 入 手 ， 然 后 应 用 一 i 
知 的 恒等式 ， 运 用 等 式 规 则 逐步 推理 ， 最 终 得 到 效率 倍增 的 解 。 在 这 一 过 程 中 ， 学 生 不 仅 理 解 了 程序 的 性 
质 ， 而 且 实现 了 更 高 效 的 计算 。 
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Ne 一 
| 前 言 
Thinking Functionally with Haskell 


本 书 是 《JIntroduction to Functional Programming Using Haskell ，Second Edition》 的 全 新 
升级 ， 主 要 变化 有 : 重新 组 织 部 分 介绍 性 内 容 ， 以 适应 一 个 学 期 或 者 两 个 学 期 课程 的 不 同 
需要 ; 几 个 新 的 实例 ; 100 多 道 习题 及 其 答案 。 与 以 前 的 版 本 一 样 ， 本 书 不 需要 读者 具有 
计算 机 或 者 程序 设计 知识 ， 因 此 本 书 适 用 于 计算 专业 的 第 一 门 课程 。 

在 编写 教材 时 ， 每 个 作者 各 具 风 格 ， 本 书 也 不 例外 。 尽 管 现在 有 很 多 关于 Haskell 的 
书 、 教 程 、 文 章 和 博客 等 ， 但 是 很 少 有 人 强调 用 数学 思维 思考 图 数 式 程序 设计 的 能 力 ， 在 
我 看 来 ， 正 是 这 种 能 力 使 其 成 为 有 史 以 来 最 棒 的 程序 设计 方法 。 这 其 中 所 涉及 的 数学 知识 
既 不 新 也 不 复杂 ， 任 何 学 过 高 中 数学 (如 三 角 函 数 ) 并 且 应 用 三 角 函 数 恒 等 式 化 简 过 正 余 
弦 表 达 式 (一 个 典型 的 例子 : 将 sin3a 用 sina 来 表示 ) 的 学 生 很 快 会 发 现 ， 在 程序 设计 问 
题 中 所 要 做 的 工作 是 完全 类 似 的 。 使 用 函数 式 程序 设计 所 获得 的 回报 是 更 快 的 计算 。 即 使 
在 30 年 后 ， 我 依然 使 用 这 样 的 方法 ， 并 能 从 中 得 到 很 大 的 快乐 : 在 解决 问题 时 首先 从 一 
个 简单、 明显 却 不 太 高 效 的 方法 入 手 ， 然 后 应 用 一 些 熟 知 的 恒等式 ， 最 后 得 到 一 个 高 效 10 
们 的 解 。 当 然 ， 如 果 我 运气 好 的 话 。 

如 果 上 一 段 的 最 后 一 句 让 你 失去 兴趣 ， 如 果 你 一 直 在 远离 数学 的 “ 魔 多 ”(Mordor) ， 
那么 本 书 可 能 不 适合 你 。 我 只 是 说 有 这 种 可 能 ， 但 也 不 一 定 (没有 人 愿意 失去 读者 )。 我 
们 在 学 习 一 种 新 的 、 令 人 兴奋 的 编程 方法 时 仍 能 得 到 不 少 乐趣 。 即 使 是 那些 因为 各 种 原因 
在 日 常 工作 中 不 能 使 用 Haskell， 而且 也 没有 时 间 计 算 更 优 解 的 程序 员 ， 仍然 因 和 学 习 
Haskell 所 带 来 的 享受 而 倍 受 鼓舞 ， 而 且 非 常 赞赏 它 既 简单 又 清晰 简洁 地 表达 计算 思想 和 
方法 的 能 力 。 事 实 上 ， 用 纯 函 数 式 表达 程序 设计 思想 的 能 力 已 经 慢 慢 地 融入 了 主流 的 命令 
式 程序 设计 语言 ， 如 Python 、Visual Basic 和 C#。 

最 后 ， 也 是 最 重要 的 一 点 : Haskell 是 一 种 大 规模 语言 ， 本 书 不 能 涵盖 一 切 内 容 。 本 
书 不 是 Haskell 的 参考 指责。 尽管 Haskell 语言 的 细节 在 每 一 页 出 现 ， 特 别 是 在 前 儿 章 ,但 
是 我 的 初衷 是 讲解 函数 式 程 序 设计 的 本 质 ， 用 函数 思考 程序 的 思想 ， 而 不 是 著述 一 种 特定 
语言 的 特点 。 但 是 ， 过 去 几 年 来 Haskell 已 经 吸收 并 实现 了 早期 函数 语言 (如 SASL、 
KRC 、Miranda、Orwell 和 Gofer) 中 表达 的 函数 式 程序 设计 的 大 多 数 思 想 ， 而 且 难 以 抵挡 
用 这 种 超 酯 语言 介绍 所 有 这 些 特性 的 诱惑 。 

书 中 出 现 的 大 多 数 程序 可 以 在 下 列 网 页 上 找到 : 

www. cs. Ox. ac. uk/ publications/ books/functional 

希望 将 来 有 更 多 习题 〈 及 答案 ) 和 编程 项 目的 建议 等 可 以 添加 进来 。 关 于 Haskell 的 
更 多 信息 ， 读 者 应 该 首选 官网 www. haskell. org。 
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格式 说 明 


习题 
习题 A ”请 用 sina 表示 sin3a。 


答案 
习题 A 答案 


sin3a 

[算术 | 

sin(2a + a) 

| 因为 sin(a +B) = sinacosB + cosasinB | 
sin2acosa + cos2asina 

| 因为 sin2aw = 2sinacosa| 


， 2 
2sinacos’ Qa + cos2asina 


= | 因为 cos2a = cos’@ - sin’a| 
2sinacos’@a + (cos’a - sin’a )sina 
= | 因为 cos*a + sin*a = 11 
sina(3 - 4sin’ a) 


以 上 证 明 格 式 是 由 Wim Feijen 发 明 的 ， 本 书 将 使 用 这 种 证 明 格式 。 
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| 第 工 章 


Thinking Functionally with Haskell 


何谓 困 数 式 程序 设计 


简 而 言 之 : 
。 图 数 式 程 序 设计 是 一 种 构造 程序 的 方法 ， 它 强调 的 是 函数 和 函数 的 应 用 ， 而 非 命 
令 及 其 运行 。 


e 国 数 式 程 序 设 计 使 用 简单 的 数学 语言 ， 使 得 问题 的 描述 更 清晰 也 更 简洁 。 
e 子 数 式 程序 设计 的 数学 基础 简单 ， 而 且 支 持 对 函数 的 性 质 进行 推理 。 
本 书 的 目的 是 使 用 一 种 称 为 Haskell 的 函数 语言 展示 以 上 3 个 特性 。 
1.1 函数 和 类 型 
本 书 将 使 用 Haskell 的 如 下 记 法 : 


于 3 > 
它 表 示 £ 是 一 个 阴 数 ， 其 参数 类 型 是 xXx， 返回 值 的 类 型 是 Y。 例 如 : 
sin ::; Float -> Float 
age :: Person -> Int 
add :; (Integer,Integer) -> Integer 


logBase :: Float -> (Float -> Float) 


Float 表示 像 3. 14159 等 浮 点 数 类 型 ; Int 表示 有 限 精 度 整 数 类 型 ， 即 满足 -2” = 
n<2” 的 整数 n; Integer 表示 无 精度 限制 整数 类 型 。 在 第 3 章 将 会 看 到 ，Haskell 包含 了 
各 种 数值 类 型 。 z 

数学 上 用 fx) 表 示 将 函数 1 应 用 于 其 参数 x。 但 是 ， 也 使 用 如 sinb 来 表示 sin(0)。 在 
Haskell 中 可 以 始终 使 用 £ x 表示 将 £ 应 用 于 参数 x。 函 数 的 应 用 运算 用 一 个 空格 表示 。 如 
果 不 使 用 括号 ， 那 么 必须 用 空格 避免 多 字母 名 可 能 引起 的 混淆 latex 是 一 个 名 ， 但 是 
late x 表 示 图 数 late 应 用 于 参数 x。 

例如 ，sin 3.14、sin (3.14) 或 sin (3.14) 是 函数 sin 应 用 于 3.14 的 3 种 合法 
表示 。 

类 似 地 ，logBase 2 10、(logBase 2) 10 或 (logBase 2)(10) 都 是 以 2 为 底 10 
的 对 数 的 正确 表示 。 但 是 ， 表 达 式 logBase (2 10 ) 是 错误 的 。 式 子 add (3 ,4) 表 示 3 
与 4 之 和 ， 其 中 的 括号 是 必需 的 ， 因 为 adq 的 参数 类 型 是 一 对 整数 ， 而 且 数 对 需要 用 括号 
和 逗号 表示 。 

再 看 看 1ogBase 的 类 型 ， 其 参数 是 一 个 浮 点 数 ， 返 回 值 是 一 个 函数 。 初 看 起 来 可 能 
有 些 奇 怪 ， 但 再 细 看 则 不 然 : 这 里 的 logBase 2 和 1logBase e 恰好 表示 了 数学 函数 log， 
和 log.。 

数学 上 有 形 如 log sin x 的 表达 式 。 对 于 数学 家 来 讲 ,该 式 子 表示 log (sin x)， 
因为 (log sin) x 没有 意义 。 但 是 在 Haskell 中 ， 必 须 说 明 一 个 式 子 的 含义 ， 而 且 必 须 将 
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该 式 子 写成 1og (sin x) ， 因 为 Haskell 将 1og sin x 解释 为 (log sin) x。 在 Haskell 
表达 式 中 函数 应 用 是 左 结合 的 ， 而 且 具 有 最 高 的 优先 级 。 (此 外 ，log 是 1ogBase e 在 
Haskell 中 的 简写 。) 

下 面 是 为 一 个 例子 。 在 三 角 晴 数 中 ，sin20 =2singcosg。 在 Haskell 中 该 式 子 写成 


sin (2*theta) = 2 * sin theta * cos theta 


我 们 不 仅 要 显 式 地 表示 乘法 ， 而 且 要 使 用 括号 表达 确切 含义 。 上 式 也 可 以 添加 更 多 括 
号 ， 写成 


sin (2*theta) = 2 * (sin theta) * (cos theta) 


但 是 ， 多 加 的 括号 不 是 必需 的 ， 因 为 函数 应 用 的 优先 级 比 乘法 的 优先 级 高 。 


1.2 函数 复合 


假设 E ::Y -> 2 和 g::X -> YY 是 两 个 函数 ， 可 以 将 这 两 个 函数 复合 成 一 个 新 的 
函数 : 


下 


该 函数 将 g 应 用 于 类 型 x 的 参数 ， 得 到 类 型 Y 的 结果 ， 然 后 将 £ 应 用 于 这 个 结果 ， 最 后 
得 到 类 型 z 的 结 采 。 我 们 将 始终 使 用 这 样 的 术语 : 函数 输入 参数 ， 返 回 结果 。 事 实 上 ， 有 


(f . g)x=f (gx) 


复合 的 顺序 是 从 右 到 左 ， 这 是 因为 我 们 把 函数 写 在 其 应 用 的 参数 左边 。 英 语 的 “ green 
pig” 中 形容 词 “ green” 解 释 为 函数 ， 它 应 用 于 名 词 短语 ， 得 到 名 词 短 语 。 当 然 ， 在 法 语 
中 情况 相反 。 


1.3 例子 : 高 频 词 


下 面 通 过 解决 一 个 问题 来 说 明 函 数 复合 的 重要 性 。《 战 争 与 和 平 》 中 出 现 最 多 的 100 
个 词 是 哪些 ?《 爱 的 徒劳 》 中 出 现 最 多 的 50 个 词 是 什么 ? 下 面 将 设计 一 个 函数 程序 求 得 答 
案 。 不 过 ， 尽 管 现 在 还 没 到 编写 一 个 完整 程序 的 时 候 ， 但 是 ， 可 以 通过 构造 足够 的 成 分 来 
展示 函数 式 程序 设计 的 精髓 。 

Oe RE 一 个 文本 ， 可 视 作 由 字符 构成 的 一 个 列表 。 这 里 的 字符 既 包 含 
可 见 学 符 如 'B' 和 ','， 也 包含 空白 字符 (blank character) ， 如 空格 和 换行 符 〈' ' 和 ' \n')。 
注意 ， 单 个 字符 用 单 引导 表示。 例如 ，'f' 是 一 个 字符 ， 而 是 一 个 名 。Haskell 用 char 
表示 字符 类 型 ， 元 素 类 型 为 char 的 列表 类 型 用 [char ] 表示 。 这 种 记 法 不 只 适用 于 字符 ， 
例如 ，[Int] 表 示 整 数列 表 ，[Float -> Float ] 表 示 函 数列 表 。 

期 竺 的 输出 是 什么 ? 答 : 如 下 形式 的 数据 。 

the: 154 

of : 580 

a:; 18 

and: 12 

in: 11 


以 上 显示 也 是 一 个 字符 列表 ， 事实 上 可 看 成 如 下 列表 : 
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1 the: i54\n of: 50\n a: i8\n and: i2\n in: ii\n" 


字符 的 列表 用 双 引 号 表示 。 更 多 列表 知识 参见 习题 。 所 以 ,我们 需要 设计 一 个 函数 ， 
不 妨 称 为 commonWords ， 其 类 型 为 


commonWords :: Int -> [Char] -> [Char] 


暴 数 commonWords n 获得 一 个 字符 列表 作为 输入 ， 返 回 该 列表 中 个 出 现 最 多 的 词 
构成 的 事 (字符 列表 的 别名 ) ， 形 如 前 面 所 述 列 表 。commonWords 的 类 型 没有 使 用 插 号 ， 
当然 也 可 以 写成 


commonWords :: Int -> ([Char] -> [Char]) 


当 一 个 类 型 中 有 两 个 相 邻 的 符号 -> 时 ,结合 的 顺序 是 自 右 问 左 ， 与 函数 应 用 的 结合 顺 
序 恰恰 相反 。 因 此 , A -> B -> C 表 示 A -> (B -> C)。 如 果 想 表示 类 型 (A -> B) -> C， 
那么 必须 使 用 括号 。 更 多 相关 知识 参见 第 2 草 。 

明白 了 给 定 的 输入 和 期 每 的 输出 后 ,不 同 的 人 有 不 同 的 解法 ， 对 问题 的 关注 点 也 不 尽 
相同 。 例 如 ， 什 么 是 一 个 “ 词 ”? 如 何 将 字符 列表 转换 为 词 的 列表 ?"Hello"、"hello" 以 
及 "Hellol! "是 不 同 的 词 还 是 相同 的 词 ? 如 何 计 算 词 的 数目 ? 需要 统计 所 有 的 词 数 ， 还 是 
只 要 计算 最 常 出 现 的 词 数 ? 等 等 。 有 些 人 觉得 这 些 过 多 的 细节 使 人 望而却步 ， 大 多 数 人 似 
乎 认为 在 计算 过 程 中 ， 某 个 时 刻 必 须 获 得 词 与 其 出 现 频率 的 列表 ， 但 是 如 何 由 该 列表 实现 
最 终 目 标 呢 ? 是 扫描 该 列表 次 ， 每 次 找 出 下 一 个 出 现 次 数 最 多 的 词 ， 还 是 有 其 他 更 好 的 
方法 ? 

首先 考虑 词 的 概念 ， 并 简单 地 假定 一 个 词 是 不 含 空格 和 换行 符 的 最 大 字符 序列 。 这 样 
的 定义 允许 把 诸如 "Hello!"、"3*4" 和 "Thelma&Louise" 等 看 作词 ,但 是 这 没关系 。 
在 一 个 文本 中 ， 一 个 词 是 有 空 日 字符 包围 的 字符 序列 ， 如 "Thelma and Louise" 包 含 3 
个 词 。 

我 们 不 准备 考虑 如 何 将 一 个 文本 分 解 成 其 组 成 元 素 ( 即 词 的 列表 ) ， 而 是 假定 存在 具 
有 这 种 功能 的 函数 : : 


words :: [Char] -> [[Char]] 


诸如 [ [char]] 这 样 的 类 型 显得 难以 记忆 ， 不 过 在 Haskell 中 总 是 可 以 引入 类 型 同义词 
(type synonyms ) : 

type Text = [Char] 

type Word = [Char] 

现在 可 以 这 样 表达 类 型 words :: Text -> [Word]，, 使 其 更 便于 记忆 。 当 然 ， 一 
个 文本 有 别 于 一 个 词 ， 前 者 可 以 包含 空白 字符 ， 后 者 则 不 然 ， 但 是 Haskell 的 类 型 同义词 
不 能 表达 这 种 细微 的 区 别 。 事 实 上 ，words 是 Haskell 的 库 函 数 ， 因 此 不 必 自 定义 。 

为 外 一 个 问题 是 "The" 和 "the" 是 否 表 示 同 一 个 词 。 它 们 实际 上 是 同一 个 词 ， 解 决 这 
个 问题 的 一 种 方法 是 将 文本 中 的 所 有 字母 都 转换 成 小 写 ， 其 他 字符 不 变 。 为 此 ， 需 要 一 个 
遇 数 toLower :: Char -> Char， 该 图 数 将 大 写字 母 转换 成 小 写字 母 ， 其 他 字符 保持 
不 变 。 为 了 将 该 函数 应 用 于 文本 的 每 个 字符 ， 需 要 下 面 的 通用 函数 : 


map :: (a -> b) -> [a] => [b] 


和 vv vv vv 要 和 


使 得 map f 应 用 于 一 个 列表 时 ，f 被 应 用 于 列表 的 每 个 元 素 。 这 样 ， 将 每 个 字母 转换 为 小 
写 由 下 列 函 数 完成 : 


map toLower :: Text -> Text 


好 了 ， 现 在 得 到 了 将 文本 转换 为 小 写字 母 词 的 列表 旺 数 words . map toLower。 下 
一 个 任务 是 计算 每 个 词 出 现 的 次 数 。 可 以 扫描 词 的 列表 ,检查 下 一 个 词 是 第 一 次 出 现 还 是 
已 经 出 现 过 ， 相 应 地 开始 新 闻 的 计数 或 者 给 对 应 词 的 计数 器 加 1。 不 过 ， 另 一 种 更 简单 的 
想法 是 对 词 的 列表 按照 字典 序 排 序 ， 结 果 是 所 有 重复 出 现 的 词 排 在 了 一 起 。 人 工 操作 时 不 
会 这 样 做 ， 但 是 通过 排序 获得 信息 的 思想 或 许 是 计算 过 程 中 最 重要 的 算法 思想 。 所 以 ， 假 
设 存在 一 个 函数 : 


sortWords :: [Word] -> [Word] 


该 函数 将 词 的 列表 按照 字典 序 排序 。 例 如 : 
sortWords ["to",'"be","or","not",'"to",'"be'] 
- [ben, "be mott "or "to bot] 

下 一 步 需 要 计算 在 有 序列 表 中 每 个 词 连续 出 现 的 次 数 。 假 定 已 有 计算 词 数 的 函数 : 


countRuns :: [Word] -> [(Int,Word)] 


例如 : 


countRuns ["be i Hpe' g not i g tor" nto' 9 Noo] 
= Lo pe") 3 也 吧 tmot1+ ) 了 C13 nor") 5 (2， n 定局 闪 7 


其 结果 是 按 字典 序 排 列 的 词 及 其 出 现 次 数 的 列表 。 

现在 来 考虑 关键 的 思想 : 希望 数据 按照 词 的 出 现 次 数 从 大 到 小 排列 ， 而 不 是 按照 词 的 
字典 序 排列 。 可 以 看 出 ， 这 就 是 一 种 排序 ， 无 需 设 计 其 他 更 聪明 的 方法 。 如 前 所 述 ， 排 序 
确实 是 程序 设计 中 非常 有 用 的 方法 。 因 此 ,假定 已 有 函数 : 


sortRuns :: [(Int,Word)] -> [(Int,Word)] 


该 函数 将 词 及 其 出 现 次 数 按照 出 现 次 数 (列表 元 素 的 第 一 个 分 量 ) 递减 排序 。 例 如 


sortRuns [(2,'"be"). (1, "not"), (1 no , (2,."t0")] 
一 以 2 "pe') 有 (2 ， "nto") 疏 二 2 IO 七 1 二 《4 tor'")] 


接 下 来 只 需 取 出 结果 列表 中 的 前 壮 个 元 素 。 为 此 ， 需 要 下 列 晒 数 : 


take :: Int -> [a] -> [al 


该 函数 使 得 take n 取得 一 个 列表 的 前 n 个 元 素 。 函 数 take 并 不 关心 列表 中 的 元 系 是 什 
么 类 型 ， 这 就 是 take 的 类 型 签名 中 出 现 了 a， 而 不 是 (Int ,Word) 的 原因 。 第 2 草 将 解 
释 这 种 思想 。 

最 后 的 步骤 仅仅 是 整理 格式 。 首 先 将 每 个 元 素 转换 成 一 个 串 ， 例如， 将 (2, "be") 转 
换 为 "be 2 "。 将 该 函数 称 为 


showRun :: (Int,Word) -> String 


类 型 string 是 Haskell 的 预定 义 类 型 ， 实 际 上 是 [char] 的 类 型 同义词 。 因 此 ， 下 列 函数 
将 词 及 其 次 数列 表 转 换 为 串 列 表 : 
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map showRun :: [(Int,Word)] -> [String] 


最 后 一 步 宕 要 使 用 下 列 函 数 : 


concat :: [[aj] -> [a] 


该 遇 数 将 元 素 的 列表 的 列表 串联 成 一 个 列表 。 同 样 ， 函 数 concat 并 不 关心 这 里 串联 的 是 
什么 “元 素 " ， 这 也 是 类 型 中 出 现 a 的 原因 。 

下 面 定义 函数 : 

commonWords :: Int -> Text -> String 

commonWords n = concat . map showRun . take n . 


sortRuns . countRuns . sortWords . 
words . map toLower 


子 数 commonWords 定义 中 使 用 了 8 个 分 图 数 ， 并 用 函数 复合 将 它们 管道 式 粘 合 起 来 。 并 
非 每 个 问题 都 可 以 这 样 直接 地 分 解 成 一 系列 子 问题 ， 但 是 ， 如 果 可 行 的 话 ， 最 后 的 程序 将 
是 简单 、 迷 人 而 且 有 效 的 。 

需要 注意 的 是 分 解 问题 的 过 程 是 如 何在 辅助 函数 的 类 型 指导 下 进行 的 。 第 二 个 经 验 
(第 一 个 经 验 是 函数 复合 的 重要 性 ) 是 ,确定 一 个 函数 的 类 型 是 找到 该 函数 合适 定义 的 第 
一 步 。 

本 节 的 目的 是 设计 一 个 解决 高 频 词 问 题 的 程序 。 结 果 是 利用 辅助 函数 给 出 了 common- 
Words 的 函数 定义 ， 这 些 辅助 函数 或 者 可 以 直接 定义 ,或 者 由 某 个 Haskell 函数 库 提供 。 
脚本 (script) 是 一 些 定义 的 集合 ， 所 以 ,我 们 实际 上 构造 了 一 个 脚本 。 肢 本 中 函数 定义 
的 顺序 并 不 重要 。 函 数 commonWords 的 定义 完全 可 以 放 在 最 前 面 ， 然 后 再 定义 辅助 消 
数 ， 或 者 先 定 义 辅助 函数 ， 最 后 给 出 主要 函数 的 定义 。 换 言 之 ,程序 员 可 以 在 脚本 中 用 任 
何 顺序 叙述 故事 。 稍 后 将 解释 如 何 用 脚本 进行 计算 。 


1.4 例子 : 数字 转换 为 词 


本 节 讨 论 另 一 个 例子 ， 并 给 出 完整 解 。 这 个 例子 展示 了 求解 问题 的 男 一 个 基本 方面 ， 
即 解决 一 个 复杂 问题 的 好 方法 ， 首 先是 简化 问题 ， 然 后 考虑 如 何 解决 更 简单 的 问题 。 
有 时 需要 把 数字 写成 词 。 例 如 
What is functional programming? 


convert 308000 = "three hundred and eight thousand" 

convert 369027 = "three hundred and sixty-nine thousand and 
twenty-seven" 

convert 369401 = "three hundred and sixty-nine thousand 
four hundred and one" 


我 们 的 目标 是 设计 这 样 一 个 函数 : 

convert :: lnt -> String 
即 对 于 一 个 给 定 的 不 超过 100 万 的 非 负 数 ， 图 数 返回 用 词 表 示 的 数字 。 如 上 所 述 ， 
String 是 Haskell 预定 义 的 类 型 [Char] 的 同义词 。 

这 里 需要 其 中 各 个 数字 的 名 称 。 一 种 方法 是 用 串 的 列表 表示 它们 : 


> units, teens, tens :: [String] 
> units = ['"zZero'",'"one",'two','"three','"four","five", 


> tgix' Hgeven' "eight 1 "nine'"] 

> teens = ['"ten",'"eleven",'"twelve'",'"thirteen","fourteen', 
> "fifteen","sixteen","seventeen","eighteen", 

> "nineteen"] 

> tens = ["twenty","thirty","forty","fifty","sixty", 

> i "seventy", "eighty", "ninety"] 


以 上 每 行 开始 的 字符 > 表示 什么 ? 答案 是 ， 在 一 个 脚本 中 ， 该 字符 表示 一 行 Haskell 
代码 ， 而 不 是 注释 。 用 . lhs 做 扩展 名 的 Haskell 文件 称 为 Haskell 文学 脚本 ( Literate 
Haskell Script) ， 习 惯 上 脚本 的 每 一 行 都 是 注释 ， 除 非 出 现 符 号 > ， 该 符号 表示 随后 的 是 
Haskell 代码 行 。Haskell 不 允许 代码 行 和 注释 紧邻 ， 所 以 代码 行 和 注释 之 间 至 少 应 该 有 一 
行 空 白 。 事 实 上 ， 你 正在 阅读 的 本 章 就 是 一 个 合法 的 . 1hs 文件 ， 完 全 可 以 将 该 文件 载 人 
Haskell 系统 并 交互 运行 。 在 今后 的 章节 将 不 再 延续 这 种 传统 〈 除 此 之 外 ， 我 们 被 迫 用 不 
同 的 名 表示 一 个 函数 的 不 同 定 义 ) ， 但 是 ,本章 展示 的 文学 编程 允许 使 用 任何 顺序 讨论 和 
书写 函数 的 定义 。 

对 于 当前 的 任务 ， 解 决 复杂 问题 的 一 个 好 方法 是 先 解 决 一 个 更 简单 的 问题 。 该 问题 的 
最 简单 情况 是 给 定 的 数字 只 有 一 位 数 ， 即 0<n <10。 假定 用 convert1 解决 这 种 简单 情 
况 。 现 在 马上 可 以 定义 : 


> converti :: Int -> String 
> converti n = units!in 


这 个 定义 使 用 了 列表 索引 运算 ( ! ! )。 对 于 给 定 的 列表 xs 和 下 标 n， 表 达 式 xs ! !n 返回 
xs 中 位 置 为 n 的 元 素 ， 其 中 位 置 从 0 开始 计算 。 特 别 地 ，units!!0 = "zero"。 而 且 ， 
units! 1!10 确实 无 定义 ， 因 为 units 只 有 10 个 元 素 ， 下 标 是 0 ~9。 一 般 地 ， 在 一 个 脚 
本 中 定义 的 函数 是 部 分 函数 或 不 完全 函数 ， 即 并 非 对 每 个 参数 返回 确切 定义 的 结果 。 

这 个 问题 的 下 一 个 最 简单 情况 是 数字 最 多 有 两 位 数 ， 即 0 <n<100。 假定 
convert2 用 于 处 理 这 种 情况 。 因 为 需要 知道 每 位 数字 是 什么 ， 所 以 首先 定义 : 


> Aigits2 3: Tnt => (Int; Tnt) 
> digits2 n = (div n 10, mod n 10) 


数字 div n k 是 n 被 k 除 的 整数 商 ，mod n k 是 余数 。 也 可 以 写成 


digits2 n = (nn div 10, n “mod” 10) 


其 中 运算 'div' 和 'mod' 是 div 和 mod 的 中 缀 形式 ， 即 运算 写 在 运算 数 的 中 间 ， 而 不 是 
写 在 运算 数 之 前 。 这 种 形式 非常 便于 改善 可 读 性 。 例 如 ， 数 学 家 会 用 x divy 和 x mod y 表 
示 这 些 表 达 式 。 注 意 ， 反 引号 (“ ) 不 同 于 表示 单个 字符 的 单 引 号 〈 ' ) 。 

现在 可 以 定义 : 


> convert2 :: Int -> String 
> convert2 = combine2 . digits2 


函数 combine2 的 定义 使 用 Haskell 的 条 件 等 式 ( guarded equation ) : 


> combine2 :: (Int,Int) -> String 
> combine2 (t,u) 


> | t==0 = units! lu 

> | t==1 = teens!lu 

> | 2<=t && u==0 = tens!!(t-2) 

> | 2<=t && u/=0 = tens!!(t-2) ++ "-" ++ units!!lu 
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欲 理解 这 段 代 码 ， 需 要 知道 Haskell 表达 等 式 和 比较 测试 的 如 下 符号 : 
== 这 和 村 
和 第 于) 
<= 水 于 年 于 ) 
这 些 函 数 具有 确切 的 类 型 ， 这 将 在 稍 后 解释 。 
我 们 还 需要 知道 两 个 测试 的 合 取 用 && 表示 。 因 此 ， 如 果 a 和 Pb 都 是 True,， 那么 a 
&& b 返回 布尔 值 True， 否 则 返回 False。 实 际 上 ， 有 


(&g&) :: Bool -> Bool -> Bool 


第 2 章 将 进一步 介绍 类 型 Bool 。 
最 后 ，( ++ ) 表示 两 个 列表 串联 的 运算 。 该 运算 不 关心 列表 的 元 素 类 型 ， 所 以 
(++) 5: [aj -> [a] -> [a] 


例如 ， 下 列 等 式 将 两 个 函数 (函数 类 型 均 为 Float -> Float) 列表 串联 : 


[sin,cos] ++ [tan] = [sin,cos,tan] 


也 可 以 串联 两 个 字符 列表 : 


sin cos' ++ "七 an = "sin cos tan" 


函数 combine2 的 定义 是 在 仔细 考虑 了 所 有 可 能 的 情况 后 得 到 的 。 稍 加 思考 后 可 以 
看 出 ， 这 里 有 3 种 主要 情况 ， 即 十 位 数 为 0、1 或 者 大 于 1 的 3 种 情况 。 对 于 前 两 种 情况 ， 
答案 是 直接 的 ， 但 是 第 3 种 情况 需要 划分 为 两 种 情况 ， 即 个 位 数 是 0 或 者 非 0。 这 些 情况 
的 书写 先后 顺序 ， 也 就 是 这 些 条 件 等 式 的 先后 顺序 并 不 重要 ， 因 为 这 些 条 件 互 不 相交 (两 
种 情况 不 会 同时 为 真 ) ， 并 且 履 盖 了 所 有 的 情况 。 

也 可 以 定义 : 


combine2 :: (Int,Int) -> String 
combine2 (t,u) 


| t==0 = units! lu 
| t==1 = teens!lu 
| u==0 = tens!!(t-2) 


| otherwise = ten8ll(t-2) ++ "-" ++ units! lu 


但 是 ， 这 里 书写 等 式 的 顺序 很 重要 。 条 件 的 计算 是 自 上 而 下 的 ， 并 将 第 一 个 计算 为 True 
的 条 件 对 应 的 等 式 右边 作为 函数 定义 的 结果 。 标 识 符 otherwise 是 True 的 同义词 ， 所 
以 它 涵盖 了 所 有 其 他 情况 。 

定义 convert2 的 男 一 种 方法 : 


convert2 :: Int -> String 
convert2 n 


| t==0 = units!iu 
| t==1 = teensllu 
| u==0 = tens!!(t-2) 


| otherwise = tens!!(t-2) ++ "-" ++ Unitsllu 
Where (t,u) = (n "div” 10, n “mod 10) 


这 里 使 用 了 where 子 句 。 这 种 子 句 引信 了 局 部 定义 ， 其 上 下 文 或 辖 域 是 convert2 定义 
的 所 有 等 式 右边 部 分 。 这 种 局 部 定义 对 于 定义 的 组 织 并 使 得 定义 可 读 性 更 强 是 非常 重要 
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的 。 对 于 本 例 来 说 ，where 子 句 避 倪 了 显 式 地 定义 男 数 digits2。 
以 上 和 定义 相对 简单 。 现 在 考虑 图 数 convert3 ， 其 参数 nn 满足 0<n<1000， 即 n 最 多 
有 3 位 数 。 其 定义 如 下 : 


> convert3 :: lnt -> String 

> convert3 n 

> | h==0 = convert2 t 

> | t==0 = units!llh ++ " hundred" 

> | otherwise = units!lih ++ " hundred and " ++ convert2 t 
> where (h,t) = (n “div. 100, n ‘mod” 100) 


使 用 这 样 的 方式 将 数字 分 解 ， 是 因为 可 以 使 用 convert2 处 理 小 于 100 的 数字 。 
现在 假定 满足 0<n<1000000， 即 可 以 有 6 位 数 。 沿 用 以 上 的 模式 ， 可 以 给 出 如 
下 定义 : 


> convert6 :: Int -> String 
> convert6 n 
> | m==0 convert3 h 


| t==0 = convert3 m ++ " thousand" 

| otherwise = convert3 m ++ '" thousand' ++ link h ++ 
convert3 h 

where (m,h) = (n “div. 1000,n “mod” 1000) 


> 
> 
> 
> 
对 于 0<m 且 0<h<100， 表示 m 的 词 与 表示 4 的 词 之 间 需 要 一 个 连接 词 “and”， 所 
以 定义 : 
> link :: Int -> String 
> link h = if h < 100 then ”and " else " " 


该 定义 使 用 了 条 件 表达 式 : 


if <test> then <expri> else <expr2> 


也 可 以 使 用 条 件 等 式 : 


link h | h < 100 = "and " 
| otherwise = 1 " 


根据 不 同情 况 ， 有 时 一 种 表达 式 可 读 性 较 强 ， 有 时 男 一 种 可 读 性 更 强 。 这 里 的 if、 
then 和 else， 以 及 其 他 的 一 些 词 ， 称 为 Haskell 保留 字 ， 这 也 意味 着 程序 员 不 可 以 使 用 
这 些 词 做 其 他 定义 的 名 称 。 

注意 函数 convert6 是 如 何 使 用 简单 的 函数 convert3 来 定义 的 ， 同时 注意 
convert3 是 如 何 用 更 简单 的 函数 convert2 来 定义 的 。 这 是 函数 定义 的 一 般 方法 。 在 本 
例 中 ， 简 单 情况 的 考虑 都 派 上 了 用 场 ， 因 为 最 后 男 数 的 定义 使 用 了 简单 情况 的 定义 。 

另外 一 点 ， 把 所 求 的 函数 命名 为 convert6， 但 是 开始 时 称 该 函数 为 convert。 没 
关系 ， 可 以 定义 : 


> convert :: Int -> String 
> convert = convert6 


下 面 需 要 做 的 是 将 函数 convert 应 用 于 一 些 输 入 参数 。 怎 么 做 呢 ? 


1.5 ”Haskell 平台 


访问 网 页 www. haskell. org 可 以 看 到 如 何 下 载 Haskell 平台 (Haskell Platform ) 。 该 平台 
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是 可 用 于 运行 Haskell 脚本 的 工具 和 包 的 集合 。 平 台 包 括 支 持 Windows、Mac 和 Linux 的 3 
种 版 本 ， 本 书 只 介绍 Windows 版 本 ， 因 为 其 他 版 本 的 用 法 相似 。 

平台 中 的 一 种 工具 是 交互 式 计算 问 ， 称 为 GHCi。 它 是 Glasgow Haskell Compiler Inter- 
preter 的 简称 。 计 算 器 有 Windows 版 本 ， 称 为 WinGHCi。 打 开 该 窗口 将 会 看 到 下 列 信息 : 


GHCi, version 7.6.3: http://www.haskell.org/ght/ :? for help 


Loading package ghc-prim ... linking ... done. 
Loading package integer-gmp ... linking ... done. 
Loading package base ... linking ... done. 
Prelude> 


这 里 的 提示 符 Prelude > 表示 包含 预定 义 的 函数 、 类 型 和 其 他 值 的 标准 库 已 经 载 人 
系统 ， 现 在 CHCi 可 以 用 作 超 级 计算 盏 : 


Prelude> 3-”5 

243 

Prelude> import Data.Char 

Prelude Data.Char> map toLower "HELLO WORLD!" 
"hello world!" 

Prelude Data.Char> 


函数 toLower 在 库 Data .char 中 定义 。 将 该 库 输入 后 ， 用 户 便 可 以 使 用 库 中 定义 
的 函数 了 。 注 意 提示 符 的 变化 ， 它 显示 了 已 经 输入 的 库 。 这 样 的 提示 符 很 快 会 变 得 很 长 。 
但 是 ， 用 户 任何 时 候 都 可 以 修改 提示 符 : 

Prelude> :set prompt ghci> 

ghci> 
为 简洁 起 见 ， 本 书 将 使 用 这 种 简单 提示 符 。 

用 户 可 以 输入 一 个 脚本 ， 如 包含 图 数 convert 定义 的 Numbers2Words: 


ghci> :load "Numbers2Words.1lhs" 

[1 of 1] Compiling Main ( Numbers2Words.lhs, interpreted ) 
Ok, modules loaded: Main. 

ghci> 


第 2 章 将 介绍 模块 的 概念 。 例 如 ， 现 在 可 以 键入 : 

ghci> convert 301123 

"three hundred and one thousand one hundred and twenty-three" 

ghci> 

本 草 最 后 以 习题 结束 。 这 些 习 题 包括 其 他 有 趣 的 知识 ， 应 该 视 为 本 章 内 容 的 有 机 组 成 
部 分 。 这 也 适用 于 后 续 的 章节 ， 所 以 ， 即 使 你 不 打算 回答 这 些 问题 ， 也 请 阅读 问题 。 习 题 
答案 附 在 习题 后 面 。 


1.6 习题 


习题 A ”考虑 将 一 个 整数 加 倍 的 函数 : 


double :: Integer -> Integer 
double Xx = 2*x 


下 列表 达 式 的 值 是 什么 ? 
map double [1,4,4,3] 


map (double . double) [1,4,4,3] 
map double [] 
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假设 sum :: [Integer] -> Integer 是 对 一 个 整数 列表 求 和 的 函数 。 下 列 哪些 等 
式 成 立 ? 为 什么 ? 
sum . map double = double . sum 


sum . map sum = sum . concat 
sum . sort = sum 


读者 需要 回顾 函数 concat 的 功能 。 函 数 sort 将 一 个 数 的 列表 按照 递增 顺序 排序 。 

习题 B 在 Haskell 中 ， 函 数 应 用 的 优先 级 高 于 其 他 任何 运算 ， 所 以 ，dqouble 3 +4 
等 同 于 (double 3) +4， 而 不 是 aouble (3 +4)。 下 列 哪些 式 子 是 sin”9 在 Haskell 中 的 
表示 ?( Haskell 的 此 用 “^” 表 示 。) 


sin“2 theta sin theta“2 (sin theta) “2 


如 何 用 Haskell 合式 表达 式 表 示 sin20/27? 

习题 C ”如 前 所 见 ， 一 个 字符 ， 即 类 型 为 char 的 元 素 ， 用 单 引号 表示 ; 一 个 串 用 双 
引号 表示 。 特 别 是 ， 串 "Hello World! "不 过 是 下 面 列表 的 简短 表示 。 

CH, er To We 1 

一 般 的 列表 用 中 括号 和 去 号 表示 。 (顺便 说 明 ， 小 括号 是 圆 形 的 ， 中 括号 是 方形 的 ， 
大 括号 是 花 的 。) 因此 ，'H' 和 "H" 具 有 不 同 的 类 型 。 它 们 的 类 型 是 什么 ? 2001 和 
"2001" 的 区 别 是 什么 ? 

运算 ++ 将 两 个 列表 串联 。 请 化 简 下 列 式 子 : 


[2 


"Hello" ++ " Worldln 
[1,2,3] ++ 口 
nHello" 十 十 时 杀 十 十 Worldil" 


习题 D 在 高 频 词 一 例 中 ， 首 先 每 个 字母 被 转换 为 小 写 ， 然 后 计算 文本 中 的 词 。 另 一 
种 方法 是 反 过 来 ， 先 计算 文本 中 的 词 ， 然 后 将 每 个 词 中 的 每 个 字母 转换 为 小 写 。 第 一 种 方 
法 可 以 表示 为 words . map toLower ， 请 给 出 第 二 种 方法 的 类 似 表达 式 。 

习题 E ”如果 一 个 运算 @ 满 足 x @(y @z) = (x @y)@z， 则 称 它 是 可 结合 的 〈associa- 
tive) 。 数 的 加 法 是 可 结合 的 吗 ? 列表 的 串联 可 结合 吗 ? 函数 的 复合 可 结合 吗 ? 请 给 出 一 个 
不 可 结合 的 数 的 运算 的 例子 。 

如 果 一 个 元 素 e 满足 : 等 式 x @e =e @x =x 对 所 有 的 x 成立， 则 称 e 为 人 @@ 的 单位 元 
(identity element) 。 请 问 加 法 、 串 联运 算 和 函数 复合 的 单位 元 各 是 什么 ? 

习题 F “我 妻子 有 一 本 书 ， 书 名 为 《EHT CDOORRSSW AAAGMNR ACDIINORTY 》， 
书 中 包含 下 面 这 样 的 列表 : 

6-letter words 


eginor: ignore,region 
eginrr: ringer 
eginrs: resign,signer,singer 


没 错 ， 这 是 一 本 吻 位 构 词 词典 。 易 位 构 词 的 字母 被 排序 ， 并 将 这 些 结果 按照 字典 序 存 储 。 
与 每 个 易 位 构 词 相 关 的 是 用 这 些 字 母 构 成 的 英文 单词 。 请 描述 如 何 设计 一 个 函数 : 
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anagrams :: Int -> [Word] -> String 


使 得 anagram n 可 以 从 一 个 按照 字典 序 排列 的 英文 单词 列表 中 恰好 抽取 出 个 字母 的 词 ， 
并 生成 一 个 串 ， 当 串 被 显示 时 ,结果 是 n 个 字母 词 的 易 位 构 词 列 表 。 不 需要 定义 各 种 函 
数 ， 只 要 给 出 这 些 函 数 的 名 和 类 型 ， 并 描述 每 个 函数 的 功能 即 可 。 

习题 G 用 一 首 歌 结束 本 他 习题 : 

One man Went to mow 

Went to mow a meadow 


D0ne man and his dog 
Went to mow a meadow 


Two men went to mow 

Went to mow a meadow 

Two men, one man and his dog 
Went to mow a meadow 


Three men went to mow 
Went to mow a meadow 
Three men, two men, one man and his dog 
Went to mow a meadow 


设计 一 个 Haskell 疯 数 song :: Int -> String, 使 得 song n 是 nn 个 人 (n men) 
的 歌词 。 假设 n < 10。 
要 打印 这 首 歌 ， 可 以 键入 : 


ghci> putStrLn (Song 5) 


冰 数 put StrLn 将 在 第 2 章 介绍 。 建 议 这 样 开 始 : 


song n = if n==0 then "" 
else song (n-1) ++ "\n" ++ verse n 
verse n = linel n ++ line2 n ++ line3 了 ++ line4 n 


这 样 可 以 用 递归 定义 song。 
1.7 答案 
习题 A 答案 
map double [1,4,4,3] = [2,8,8,6] 
map (double . double) [1i,4,4,3] = [4,16,16,12] 
map double [] = [] 
由 此 可 知 ，[] 表 示 空 列表 。 
以 下 所 有 等 式 成 立 : 
sum . map double = double . sum 
sum . map sum = sum . concat 
sum . sort = SUm 


事实 上 ，3 个 等 式 中 每 个 均 是 以 下 3 个 更 简单 定律 的 结论 。 


a*(x+y) = ax*x + a*y 
X+(y+Z) = (x+y)+z 
X+y = y+x 


当然 ， 现 在 还 不 清楚 如 何 证 明 这 些 等 式 成 立 。( 此 外 ， 为 了 避免 混乱 ， 使 用 打字 机 体 
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和 


符号 = 表示 两 个 表达 式 的 相等 。 但 是 ， 数 学 符号 = 用 于 如 sin20 =2sinbcosb 的 等 式 。) 
习题 B 答案 表达 式 sin theta^2 和 (sin theta)^2 都 正确 ,但 是 sin ^2 theta 
是 错误 的 。sin29/27 在 Haskell 中 的 表示 为 


sin (2*theta) / (2*pi) 


注意 ， 如 果 写 成 

sin (2*theta) / 2 * pi = (sin (2*theta) / 2) * Pi 
则 不 符合 要 求 。 原 因 是 /和 * 这 样 的 运算 具有 同样 的 优先 级 ， 并 且 是 左 结合 的 。 第 2 章 将 
进一步 讨论 这 些 问 题 O 


习题 C 答案 

‘Ht :: Char 
“HH” :: [Char] 
2001 :: Integer 
"2001" :: [Char] 


此 外 ，' \ 表示 转 义 字 符 ， 所 以 ' nn' 表示 换行 符 ，' \t ' 表 示 制 表 符 〈tab 字符 ) 。 同 
样 ，' \N' 表示 反 斜 和 位, " \m "表示 反 斜 枉 和 字母 n 这 两 个 字符 构成 的 列表 。 所 以 ， 文 件 路 
径 C: \firefox \stuff 用 Haskell 字符 串 表 示 成 "C: \\firefox\\stuff"。 


LX) ++ (2; = [L27353;254] 
"Hello" ++ " World!" = "Hello World!" 
[1,2,3] ++ 口 = [1,2,3] 


"Hello" ++ "" ++"World!" = "HelloWorld!" 


如 果 你 的 最 后 两 个 答案 正确 ， 那 么 你 就 理解 了 [] 表示 任 何 对 象 的 空 列表 ," "表示 字符 
的 空 列表 。 

习题 D 答案 “将 每 个 词 中 的 每 个 字母 转换 为 小 写 ” 包 含 了 答案 的 线索 。 将 一 个 词 
中 每 个 字母 转换 为 小 写 可 表示 成 map toLower， 所 以 这 个 问题 的 答案 是 map (map 
toLower)。 这 也 表示 下 列 等 式 成 立 : 


words . map toLower = map (map toLower) . words 


习题 E 答案 数值 加 法 、 列 表 串 联 和 函数 复合 都 是 可 结合 的 。 当 然 ， 数 的 减法 不 可 结 
合 ， 医 运算 也 不 可 结合 。 加 法 的 单位 元 是 0， 串 联 的 单位 元 是 空 列表 ， 函 数 复合 的 单位 元 
是 下 面 定 义 的 恒 等 函 数 : 


dQ 3 一 > 所 
证 总 区 下 及 


习题 F 答案 这 个 习题 可 仿照 3. 1 节 来 解 。 一 种 定义 函数 anagrams n 的 方法 如 下 : 
1. 使 用 下 列 函 数 ， 抽 取 长 度 为 n 的 词 : 


getWords :: Int -> [Word] -> [Word] 


2. 给 每 个 词 添加 一 个 标签 。 标 签 包含 构成 该 词 的 字母 ， 并 按照 字母 序 排列 。 例 如 ， 
word 变 成 了 标签 和 词 的 二 元 组 ("dorw"，, "word")。 下 列 函 数 可 以 完成 添加 标签 : 


addLabel :: Word -> (Label ,Word) 


其 中 : 
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type Label = [Char] 


3. 将 标签 词 列表 按照 标签 的 字典 序 排序 ， 该 函数 具有 下 列 类 型 : 


sortLabels :: [(Label,Word)] -> [(Label ,Word)] 


4. 将 每 组 标签 相同 的 连续 相 邻 标签 和 词 的 二 元 组 用 一 个 新 的 二 元 组 代替 ， 这 个 新 的 
二 元 组 的 第 一 个 分 量 是 它们 的 共同 标签 ， 第 二 个 分 量 是 具有 这 个 相同 标签 的 词 的 列表 。 该 
困 数 定义 为 


groupByLabel :: [(Label,Word)] -> [(Label, [Word])] 


5. 利用 下 列 函 数 将 前 面 得 到 的 每 个 二 元 组 替换 ， 并 将 结果 串联 在 一 起 : 


showEntry :: (Label, [Word]) -> String 


最 后 得 到 


anagrams n = concat . map showEntry . groupByLabel . 
sortLabels . map addLabel . getWords n 


习题 G 答案 ”一 种 可 能 解 是 


song n = if n==0 then "" 
else song (n-1) ++ "\n" ++ verse n 
verse n = linel n ++ line2 n ++ line3 n ++ line4 n 


linel n = if n==1 then 

"One man went to mow\n' 

else 

numbers!!(n-2) ++ " men went to mow\n' 
"Went to mow a meadow\n' 

if n==1 then 

"One man and his dog\n" 

else 

numbers!ll(n-2) ++ " men, '" ++ Count (n-2) 
++ "one man and his dog\n" 

line4 n = "Went to mow a meadow\n\n' 


line2 n 
line3 n 


count n = if n==0 then "" 
else 
numbs!!(n-1) ++ 1 men, " ++ count (n-1) 


numbers = ["Two", "Three", "Four", "Five", "Six", 
"Seven", "Eight", "Nine"] 
numbs = [wo "threo", “OU “five "slr"; 
"seven", "eight"] 
注意 ， 脚 本 中 省 略 了 辅助 函数 和 值 的 类 型 。 尽 管 Haskell 可 以 推导 出 所 有 函数 和 值 的 
正确 类 型 ， 但是， 好 的 习惯 是 在 脚本 中 说 明 它 们 的 类 型 ， 即 使 这 些 类 型 很 简单 也 要 说 明 。 
脚本 中 明确 的 类 型 签名 使 得 脚本 更 容易 阅读 ， 而 且 对 于 检查 定义 的 合理 性 也 很 有 帮助 。 


1.8 注 记 


如 果 读 者 对 Haskell 的 起 源 感 兴趣 ， 那 么 一 定 要 阅读 《Haskell 的 历史 》 ( The History of 
Haskell) ， 可 以 从 下 列 链接 得 到 文章 的 拷贝 : 


research. microsoft. com/~ simonpj/ papers/ history- of- haskell 
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Haskell 的 一 个 永恒 的 优势 是 它 没 有 设计 成 一 种 封闭 的 语言 ， 并 鼓励 研究 人 员 通 过 扩 
展 语言 或 者 添加 函数 库 和 尝试 新 的 程序 设计 思想 和 技术 。 所 以 ，Haskell 是 一 种 大 规模 语言 ， 
读者 可 以 找到 关于 Haskell 各 个 方面 的 大 量 书籍 、 辅 导 教 程 和 论文 ,包括 最 近 由 Simon 
Marlow (0O’ Reilly，2013) 编写 的 《Haskell 并 行 与 并 发 程序 设计 》 (Parallel and Concurrent 
Programming in Haskell ) 。 

网 页 www. haskell. org 包含 大 量 有 关 资 料 的 链接 指引 。 不 过 ， 我 在 撰写 本 书 时 ， 桌 上 
始终 摊 开 着 三 本 书 。 一 本 是 由 Simon Peyton Jones 等 编写 的 《Haskell 98 语言 和 库 修 订 报 
告 》( Haskell 98 ，Languages and Libraries ，The Revised Report) (剑桥 大 学 出 版 社 ，2003 ) 。 

报告 对 于 理解 Haskell 第 一 标准 版 Haskell 98 的 本 质 是 必 不 可 少 的 。 报 告 的 在 线 版 可 以 
从 下 列 链接 获得 : 

www. haskell. org/ onlinereport 
本 书 大 部 分 内 容 遵 循 标 准 版 本 ,但 是 无 论 如 何 并 未 涵盖 整个 语言 。 

之 后 一 个 新 版 本 Haskell 2010 已 经 发 布 ， 参见 

haskell. org/ onlinereport/ haskell2010/ 

其 中 的 一 个 变化 是 模块 名 使 用 层次 结构 ， 例 如 ， 使 用 列表 工具 时 调用 模块 Data .List， 
而 不 是 简单 地 写 List。 

另外 两 本 书 是 由 Bryan 0 " Sullivan 、John Goeerzen 和 Don Stewart 编写 的 《真实 世界 的 
Haskell》 ( Real World Haskell) (0O’ Reilly，2009) ， 以 及 由 Graham Hutton 编写 的 《Haskell 
程序 设计 》 (剑桥 大 学 出 版 社 ，2007 ) 。 一 如 其 名 ， 前 一 本 书 主 要 介绍 非常 实际 的 应 用 ， 
后 一 本 书 是 入 门 教程 。Graham Hutton 曾 笑 着 建议 我 将 本 书 命名 为 《象牙 塔 Haskell》 。 

关于 高 频 词 问题 的 历史 非常 有 趣 。Jon Bentley 曾 请 一 位 程序 员 Don Knuth 编写 一 个 高 
频 词 的 文学 WEB 程序 ， 然 后 请 另 一 位 程序 员 Doug Mcllroy 给 程序 一 个 文学 评论 ， 结 果 刊 
登 在 Bentley 所 撰写 的 文章 “Programming Pearls”， 见 Communications of the ACM. vol 29 ， 
no.6 (June 1986 ) 。 
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表达 式 、 类 型 和 值 





Haskell 的 每 个 合式 〈well-formed) 表达 式 根 据 其 定义 都 有 一 个 合式 类 型 ， 并 且 每 个 合 
式 表 达 式 根据 其 定义 都 有 一 个 值 (value) 。 对 一 个 给 定 表达 式 求 仁 时 ， 步 又 如 下 : 

。 GHCi 检查 该 表达 式 在 语法 上 是 否 正确 ， 即 表达 式 是 否 符 合 Haskell 的 语法 规则 。 

。 如 果 表 达 式 语法 正确 ，GHCi 推导 出 该 表达 式 的 类 型 ， 或 者 检查 程序 员 指定 的 类 型 
是 否 正 确 。 

。 如 果 表 达 式 类 型 正确 ，GHCi 对 表达 式 求 值 : 将 表达 式 化 简 为 最 简单 形式 ， 即 为 其 
值 。 如 果 该 值 可 打印 ，GHCi 将 其 显示 在 终端 。 

本 章 将 仔细 研究 Haskell 的 求 值 过程 。 


2.1 GHCi 会 话 


检查 一 个 表达 式 是 否 为 合式 的 方法 当然 是 使 用 GHCi。GHCi 有 一 个 命令 :type expr， 
如 果 表 达 式 expr 是 合式 ， 则 命令 返回 其 类 型 。 以 下 是 一 个 GHCi 会 话 (对 某 些 CHCi 返 
回信 息 做 了 简化 ) : 


ghci> 3 +4) 
<interactive>:1:5: parse error on input “)' 


GHCi 在 抱怨 第 1 行 第 5 个 字符 不 符合 系统 的 要 求 ， 换 句 话 说 ,该 表达 式 在 语法 上 是 
错误 的 。 

ghci> :type 3+4 

3+4 :: Num a => a 


GHCi 推断 3 +4 的 类 型 是 一 个 数值 类 型 。 稍 后 将 对 此 做 进一步 解释 。 


ghci> :type if 1==0 then 'a' else "a" 

<interactive>:1:23: 

Couldn't match expected type ‘Char' with actual type “ [Char]' 
In the expression: "a" 

In the expression: if 1 == 0 then 'a' else "a" 


在 一 个 条 件 才 达 坟 中 : 


if test then expT1 else expr2 


GHCi 要 求 exprl 和 expr2 的 类 型 必须 是 相同 的 。 但 是 ， 一 个 字符 不 是 字符 的 列表 。 所 
以 ， 尽 管 该 条 件 语句 符合 Haskell 语法 ， 但 它 不 是 合式 。 

ghci> sin sin 0.5 

<interactive>:1:1: 

No instance for (Floating (a0 -> a0)) 

arising from a use of “sin' 

Possible fix: add an instance declaration for 

(Floating (a0 -> a0)) 
In the expression: sin sin 0.5 
In an equation for “it': it = sin sin 0.5 
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GHCi 返回 一 个 很 模糊 的 错误 信息 ,说 明 该 表达 式 不 是 合式 。 
ghci> sin (sin 0.5) 
0.4612695550331807 
呵 哈 ，GHCi 对 这 个 表达 式 很 满意 。 
ghci> :type map 
map :: (a -> b) -> [a] -> [b] 
CHCi 返回 该 函数 的 类 型 。 
ghci> map 
<interactive>:1:;1: 
No instance for (Show ((a0 -> b0) -> [a0] -> [b0])) 
arising from a use of “print' 
Possible fix: 
add an instance declaration for 


(Show ((a0 -> b0) -> [a0] -> [b0])) 

In a stmt of an interactive GHCi command: print it 

GHCi 表示 不 知道 如 何 打印 一 个 函数 。 

ghci> :type 1 div” 0 

1 “div 0 :: Integral a => a 

GHCi 表示 1“ div` 0 的 类 型 是 整 型 数 。 因 此 ,1 `div` 0 是 合式 ， 并 有 一 个 值 。 

ghci> 1 “div” 0 

*** Exception: divide by Zero 

GHCi 返回 一 个 错误 信息 。 那 么 1`“ qiv` 0 的 值 是 什么 ? 答案 是 ， 这 是 一 个 很 特殊 的 
值 ， 数 学 上 记 作 上 ， 读 作 “bottom”。 实 际 上 ，Haskell 给 这 个 值 提 供 了 和 名称， 不 过 不 是 
bottom， 而 是 undefined。 


ghci> :type undefined 

undefined :: a 

ghci> undefined 

水 来 沙 Exception: Prelude.undefined 


Haskell 不 会 显示 上 这 个 值 。 它 可 能 返回 一 个 错误 信息 ， 也 可 能 在 计算 无 限 循环 ， 因 
而 一 直 保 持 沉默 ， 直 至 用 户 中 断 该 无 穷 计算 过 程 。 这 种 计算 也 可 能 引起 CHCi 朋 沉 。 是 的 ， 
没 包 。 


ghci> x*x Where x = 3 
<interactive>:1:5: parse error on input “Where 


ghci> let x = 3 in x*x 
9 


在 Haskell 中 一 个 where 子 句 不 构成 一 个 表达 式 ， 一 个 定义 的 等 号 右边 的 整个 式 子 才 
是 一 个 表达 式 s 所 以 ， 以 上 第 一 个 式 于 不 征 人 台式 霄 达 式 。 为 一 方面 ,在 一 个 let 表达 
起 中 


let “defs> in <expr> 


假定 < defs > 中 的 定义 是 合式 ， 而 且 < expr > 是 合式 ， 那 么 该 Let 表达 式 是 合式 。Let 
表达 式 在 后 面 使 用 不 多 ， 但 有 的 时 候 这 种 表达 式 很 有 用 。 
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2.2 名 称 和 运算 符 


如 前 所 讲 ， 一 个 脚本 是 一 些 名称 及 其 定义 的 集合 。 函 数 和 值 的 名 以 小 写字 母 开 头 ， 但 
是 数据 构造 器 〈 稍 后 介绍 ) 以 大 写字 母 开头 。 类 型 名 (如 Int)、 类 族 名 (如 Num) 和 模 
块 名 (如 Prelude 和 Data.char) 也 以 大 写字 母 开 头 。 

一 个 运算 符 是 一 种 出 现在 参数 中 间 的 特殊 函数 名 ， 如 x + y 中 的 +、xs ++ ys 中 的 
++。 运 算 符 以 符号 开头 。 任 何 〈 非 符号 ) 二 元 函数 都 可 以 用 反 引 号 将 其 括 起 来 ， 从 而 转 
换 成 一 个 运算 符 ， 而 且 任 何 运算 符 用 括号 括 起 来 就 变 成 了 前 缀 名 。 例 如 : 

3 +4 等 同 于 (+) 3 4 

div 3 4 等 同 于 3 “div” 4 

运算 符 有 不 同 的 优先 级 (结合 力 )。 例 如 : 

3*4+2 等 同 于 (3* 4) + 2 

XxS ++ yss !1 3 等 同 于 xs ++ (yss !! 3) 

如 有 疑问 ， 可 使 用 括号 消除 歧义 。 另 外 ， 可 以 使 用 读者 喜欢 的 任何 名 称 来 命名 列表 ， 包 
括 x、y、goodylist， 等 等 。 但 是 ,一 个 便于 记忆 的 简单 规则 是 ， 用 x 表示 对 象 ， 
xs 表示 对 象 的 列表 ，xss 表示 对 象 列表 的 列表 。 这 也 就 解释 了 上 面 最 后 一 行使 用 yss 
的 原因 。 

优先 级 相同 的 运算 符 通常 有 一 定 的 结合 顺序 ， 左 结合 或 者 右 结合 。 例 如 ， 普 通 的 算术 
运算 是 左 结 合 的 : 

3~-4-2 等 司 于 (3-4=2 

3~4+2 等 同 于 (3=4)+2 

3/4*5 等 同 于 (3/ 4)*5 

函数 应 用 运算 具有 最 高 优先 级 ， 而 且 是 左 结 合 的 : 

eee bah gum 等 同 于 (eee bah) gum 

eee bah gum*2 等同 于 ((eee@ bah) gum)*2 

有 些 运算 是 右 结 合 的 : 

(a -> Db》 -> [a] -> fb] 等 间 于 《& "> b) -> 《JJ => [bl1) 

kk 等 同 于 x“~(y~ 2) 

eee . bah . gum 等 同 于 eee . (bah . gum) 

当然 ， 如 果 一 个 运算 满足 结合 律 ， 如 函数 复合 ， 那 么 结合 的 不 同 顺 序 对 结果 没有 影响 
( 值 是 一 样 的 ) 。 同 样 ， 仍 然 可 以 用 括号 消除 可 能 产生 的 歧义 。 

也 可 以 定义 新 的 运算 行 ， 例 如 : 


(SR 5 Tit =» TInt .~> Tat 
xX +++ y = if even x then y else x+y 


条 件 表达 式 具 有 较 低 的 优先 级 ， 所 以 ， 上 述 表达 式 等 同 于 下 列表 达 式 : 


if even x then y else (x + y) 


而 不 是 (if even x then y else x) + y。 同样, 仍然 可 以 用 括号 表达 不 同 的 组 合 。 
如 果 需 要 ， 也 可 以 说 明 ( +++ ) 的 优先 级 和 结合 顺序 ， 但 是 这 里 不 做 介绍 。 
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部 分 运算 与 兰 姆 达 表 达 式 


尽管 这 仅 是 一 种 风格 ,但 是 ， 大 体 来 讲 ， 人 们 更 吝 欢 将 所 有 辅助 函数 写 在 脚本 中 并 显 
陈 命 名 。 比 如， 如 采 需 要 给 一 个 数 加 1 的 函数 ， 或 者 将 一 个 数 加 倍 的 郴 数 ， 那 么 可 以 如 下 
显 式 命名 这 些 函数 . 


succ, double :: Integer -> Integer 
StCC n = nt+1 
double n = 2*n 


不 过 ，Haskell 提供 了 命名 这 两 个 也 数 的 其 他 方法 ， 即 (+1) 和 (2* )。 这 种 机 制 称 为 部 分 
运算 (section) 。 部 分 运算 中 包括 了 运算 符 和 部 分 参数 。 例 如 : 

oe 

(<0) n = n<0 

(1/) x = 1i/x 

部 分 运算 无 疑 是 命名 简单 辅助 函数 的 好 方法 ， 所 以 将 其 列 入 适量 使 用 的 好 东西 目录 。 

关于 部 分 运算 有 一 点 重要 附加 说 明 : 虽然 (+1 ) 表示 加 1 的 部 分 运算 , 但 是 ( -1) 并 
不 是 减 1 的 部 分 运算 ， 它 只 表示 数值 -1。Haskell 用 减 号 既 表 示 二 元 减法 运算 ， 也 表示 取 
反 的 前 级 运 算 。 

假设 欲 定义 一 个 函数 : 先 将 一 个 数 加 倍 ， 然 后 在 此 基础 上 加 1。 这 个 函数 可 以 用 两 个 
部 分 运算 的 复合 表示 为 ( +1) . (*2)。 但 是 ， 这 个 结果 并 不 令 人 满意 ， 因 为 表达 式 看 起 
来 太 神秘 ， 看 到 这 个 式 子 的 读者 必须 停顿 下 来 思考 其 含义 。 男 一 种 方法 似乎 需要 命名 这 个 
恩 数 ， 但 是 ， 什 么 样 的 名 合适 呢 ? 想 出 一 个 有 意义 的 名 称 真 难 。 

一 种 解决 方法 是 使 用 兰 姆 达 表 达 式 (lambda expression) -> 2*n+1。 在 数学 上 
这 个 函数 写成 Mn. 2n +1， 故 称 为 兰 姆 达 表 达 式 。 该 表达 式 读 作 “nn 的 函数 ， 其 返回 值 是 
2n +1”。 例 如 : 

ghci> map (\n -> 2*n+1) [1..5] 

[3,5,7,9,11] 

有 时 兰 姆 达 表 达 式 似乎 是 描述 一 个 函数 的 最 好 方法 ,但 也 仅仅 是 在 某 些 不 多 的 场合 才 
使 用 这 种 表达 式 。 


2.3 求 值 
Haskell 对 一 个 表达 式 的 求 值 过 程 是 将 其 化 简 为 最 简 形 式 ， 然 后 显示 结果 。 例 如 ， 假 
设 如 下 定义 : 


sqr :: Integer -> Integer 
Sqr X = X*X 


基本 上 有 两 种 方法 将 表达 式 sqr (3 +4) 化 简 为 最 简 形式 ， 即 49。 或 者 先 对 3 +4 求 值 ， 
或 者 先 使 用 sqr 的 定义 : 


sqr (3+4) sqr (3+4) 
= sgr 7 = let x = 3+4 in x*xX 
= let x = 7 in x*x = let x = 7 in x*xX 
= 7*7 = 7*7 


= 49 = 49 
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两 种 方法 的 化 简 步 数 一 样 ,但 是 化 简 的 顺序 稍 有 区 别 。 左 边 的 方法 称 为 最 内 优先 化 简 
(innermost reduction) ， 又 称 勤 奋 求 值 (eager evaluation ) ; 右边 的 方法 称 为 最 外 优先 化 简 
( outermost reduction ) 或 者 情 性 来 值 (lazy evluation)。 使 用 勤奋 求 值 方法 ， 总 是 先 对 参数 
求 什 ， 然 后 再 应 用 函数 。 使 用 惰性 求 值 方法 ， 总 是 先 带 入 图 数 定 义 ， 函 数 的 参数 求 值 只 有 
在 必要 时 才 进 行 。 

这 两 种 方法 是 不 是 看 似 没 多 大 区 别 ? 但 是 ， 考 虑 下 面 〈 稍 做 了 简化 ) 关于 函数 fst 
的 求 值 过 程 ， 其 中 fst 返回 一 个 二 元 组 的 第 一 个 分 量 ， 即 fst (x,y) = x。 


fst (sgr 1,sqr 2) fst (sqr 1,sqr 2) 
= fst (i*1,sqr 2) = let p = (sqgr 1,sqr 2) 
= fst (1,sqr 2) in fst p 
= fst (1,2*2) = sqgr 1 
= fst (1,4) = 1*1 
= 1 = 1 


需要 注意 到 的 关键 区 别 是 ， 勤 奋 求 值 方法 对 表达 式 sqr 2 求 值 ， 但 是 惰性 求 值 不 需要 
该 表达 式 参 与 ， 因 此 不 会 对 其 求 值 。 

假设 再 给 出 下 列 定 义 : 

infinity :: Integer 


infinity = 1 + infinity 


three :: Integer -> Integer 
three x = 3 


对 infinity 求 值 时 ，GHCi 将 尝试 计算 1 + (1 + (1 + (1 + (1 +...， 因 此 陷 
人 长 久 沉默 ， 直 至 系统 耗 尽 内 存 返 回 一 个 错误 信息 。 这 里 infinity 的 值 是 1 。 
对 three infinity 求 值 同样 有 两 种 方法 : 


three infinity three infinity 
= three (1+infinityy) = let x = infinity in 3 
= three (1+(1+infinity)) = 3 


在 这 里 勤奋 求 值 陷 人 试图 对 infinity 求 值 的 死 循 环 中 ， 但 是 惰性 求 值 立即 返回 答案 3 ， 
求 得 结果 3 并 不 需要 对 three 的 参数 求 值 。 
另 一 个 求 值 例子 是 阶乘 函数 的 一 种 定义 : 


factorial :: Integer -> Integer 
factorial n = fact (n,1) 


fact :: (Integer,Integer) -> Integer 
fact (x,y) = if x==0 then y else fact (x-1,x*y) 


这 是 另 一 个 递归 定义 (recursive defninition) 的 例子 (函数 infinity 的 定义 以 及 第 1 章 
图 数 song 的 定义 也 都 是 递归 的 ) 。 涉 及 递归 函数 的 表达 式 的 求 值 方法 与 其 他 函数 的 求 值 
方法 相同 。 

下 面 显示 两 种 求 值 方法 的 化 简 步 骤 序 列 (为 了 说 明 问题 ， 下 面 省略 了 条 件 表达 式 的 化 
简 步 又 ) : 
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factorial 3 factorial 3 
= fact (3,1) = fact (3,1) 
= fact (3-1,3*1) = fact (3-1,3*1) 
= fact (2,3) = fact (2-1,2*(3*1)) 
= fact (2-1,2*3) = fact (1-1,1i*(2*(3*1))) 
= fact (1,6) = 1*(2*(3*1)) 
= fact (1-1,1*6) = 1*(2*3) 
= fact (0,6) = 1*6 
=6 = 6 


这 里 想 说 明 的 要 点 是 ， 虽然 两 钟 方法 的 化 简 步 又 基本 相同 ,但 是 惰性 求 值 为 了 得 到 答案 需 
要 更 大 的 空间 ， 表 达 式 1* (2* (3 *1 ) ) 在 被 求 值 前 需要 先 在 内 存 中 构造 起 来 。 

惰性 求 值 的 优点 是 ， 只 要 任何 一 种 化 简 顺 序 终止 ， 惰 性 求 什 就 会 终止 ; 它 的 化 简 步 又 
数 永 远 小 于 勤奋 求 值 步骤 数 ， 而 且 有 时 是 及 其 地 小 。 惰 性 求 值 的 缺点 是 ， 它 需要 更 多 的 空 
间 ， 而 且 难 于 理解 化 简 的 准确 次 序 。 

Haskell 使 用 惰性 求 值 。ML ( 男 一 种 流行 的 函数 语言 ) 使 用 勤 禁 求 值 。 习 题 D 讨论 为 
什么 惰性 计算 是 优点 。 第 7 草 将 进一步 讨论 惰性 求 值 。 

如 果 一 个 Haskell 困 数 下 满足 fundefinea = undefinedQ， 则 称 上 是 严格 的 
(strict) ， 和 否则 称 为 非 严 格 的 〈(non-strict) 。 图 数 three 是 非 严 格 的 ， 而 ( + ) 对 于 两 个 参 
数 都 是 严格 的 。 因 为 Haskell 使 用 惰性 求 值 ， 所 以 可 以 定义 非 严格 的 图 数 。 这 也 是 为 什么 
Haskell 被 称 为 一 种 非 严 格 的 另 数 语言 。 


2.4 类 型 和 类 族 


Haskell 定义 了 内 置 (或 者 初始 ) 类 型 ， 如 Int、Float 和 char。 布 尔 值 的 类 型 
Bool 在 标准 引导 库 中 定义 : 


data Bool = False | True 


这 是 一 个 数据 声明 (data declaration) 的 例子 。 这 里 声明 了 类 型 Bool 有 两 个 数据 构造 函 
数 : False 与 True。 实际 上 类 型 Bool 有 3 个 值 (而 不 是 两 个 ): False、True 和 
undefined : : Bool。 为 什么 需要 第 三 个 值 呢 ? 考虑 下 列 晒 数 : 


to :: Bool -> Bool 
to b = not (to b) 


引导 库 中 not 的 定义 如 下 : 


i0t i: Bool => Bool 
not True = False 
not False = True 


函数 to 的 定义 是 完整 的 ， 但 是 对 to True 求 值 导致 GHCi 陷 人 无 限 循环 ， 所 以 其 值 
为 类 型 Bool 的 上 。 关 于 数据 的 声明 ， 今 后 的 章节 会 有 更 多 介绍 。 
Haskell 包含 内 置 的 复合 类 型 ， 例 如 


[Int] 元 素 类 型 为 Int 的 列表 
(Int ,Char) 一 个 Int 和 一 个 Char 的 序 对 
(Int,Char,Bool) 多 元 组 类 型 

() 零 元 组 类 型 


Int -> Int 一 个 由 Int 到 Int 的 函数 
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类 型 ( ) 的 唯一 元 素 也 用 ( ) 表 示 。 实 际 上 ， 类 型 () 还 有 第 二 个 元 素 ， 即 undefined :: ()。 
现在 明白 了 ， 每 个 类 型 都 包含 了 值 上 。 

如 前 所 讲 ， 在 定义 一 个 值 或 者 函数 时 ， 好 的 习惯 是 同时 在 定义 中 说 明 它 们 的 类 型 。 

考虑 下 一 个 函数 take n， 其 作用 是 将 列表 的 前 n 个 元 素 构成 的 列表 返回 。 该 函数 在 
第 1 章 曾 出 现 过 。 例 如 : 


take 3 [1,2,3,4,5] = [1,2,3] 
take 3 "category" = "cat" 
take 3 [sin,cos] = [sin,cos] 


应 该 给 take 赋予 什么 样 的 类 型 呢 ? 该 函数 并 不 关心 列表 的 元 系 类 型 是 什么 ， 所 以 函 
数 take 称 为 多 态 (polymorphic) 函数 ， 其 类 型 记 作 

take :: Int -> [a] -> [a 
其 中 a 是 一 个 类 型 变量 (type variable) 。 类 型 变量 用 小 写字 母 开 头 。 类 型 变量 可 以 用 任何 
类 型 替换 。 


类 似 的 多 态 男 数 还 有 : 

(CE »: [= = [a 
-2 [lb] 

(.) :: (b -> c) -> (a -> b) -> (a -> c) 


最 后 一 行 是 函数 复合 运算 的 多 态 类 型 声明 。 
那么 运算 ( + ) 的 类 型 是 什么 呢 ? 以 下 是 其 类 型 的 一 些 建议 : 


(+) :: Int -> Int -> Int 
(+) :: Float -> Float -> Float 
(+) :: a ->8a -> 8a 


前 两 个 类 型 似乎 太 局 限 ， 而 最 后 一 个 又 显得 过 于 一 般 。 例 如 ， 两 个 函数 不 可 以 相 加 ， 两 个 
字符 或 者 两 个 布尔 值 也 不 可 相 加 ， 至 少 没 有 明显 的 相 加 方法 。 
解决 这 个 问题 的 方法 是 引入 类 族 (type class ) : 


(+) :: Num a => a -> a -> a 


这 个 声明 断言 ( + ) 的 类 型 为 a -> a -> a,， 其 中 a 是 任意 数值 类 型 。 一 个 类 族 ， 如 
Num， 包 含 了 一 些 命名 的 方法 ， 如 (+ ) ， 这 些 方法 在 类 族 的 不 同 实 例 上 可 以 有 不 同 的 定 
义 。 因 此 ， 类 族 提供 了 重 载 (overloaded) 的 函数 ， 即 同一 个 函数 名 在 不 同类 型 上 可 以 有 
不 同 的 定义 。 重 载 是 另 一 种 多 态 。 

数值 类 型 相当 复杂 ， 将 会 在 第 3 章 详细 讨论 ， 所 以 在 这 里 介绍 一 个 比较 简单 的 类 族 : 


class Eq a Where 
==),(/=) :: a -> a -> Bool 
x /=y = not (x == y) 
这 个 定义 引入 了 类 族 Equality， 该 类 族 的 成 员 可 以 使 用 它 的 方法 ， 即 同一 个 相等 测试 
( == ) 和 不 相等 测试 (/= ) 。 类 族 给 出 (/= ) 的 缺 省 (default) 定义 ， 所 以 用 户 只 需要 给 出 
( == ) 的 定义 。 
一 个 类 型 要 成 为 类 族 Eq 的 成 员 ， 必 须 定 义 一 个 实例 (instance)。 例 如 : 


攻关 
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instance Eq Bool where 
xX ==y = if x then y else not y 


instance Eq Person where 
x ==Yy = (pin x == pin y) 


如 果 pin :: Person -> Pin,， 那么 后 一 个 实例 的 正确 性 需要 Eq Pin。 当 然 ， 并非 
必须 将 Person 定义 成 Equality 俱乐部 的 成 员 ， 也 可 以 使 用 下 面 的 定义 : 

samePerson ::; Person -> PerSon -> Bool 

samePerson x y = (pin x == pin y) 
但 是 ， 在 程序 中 便 不 能 用 ( == ) 代替 samePerson， 除 非 定 义 Person 是 Eq 的 实例 。 

下 面 是 另外 两 个 类 族 ora 和 Show 的 简化 定义 : 


class (Eq a) => Ord a where 
(<), (<=), (>=),(>) :: a -> a -> Bool 
x <y = not (x >= y) 
x <=y=x==y ||x<y 
x >=y=x==y ||x>y 
x >Yy = not (x <= y) 


class Show a where 


show :: a -> String 
布尔 运算 (11 ) 表示 析 取 al1b 为 真 ， 仅 当 a 和 bb 中 至 少 有 一 个 为 真 。 这 个 运算 可 以 如 
下 定义 : 


(||) :: Bool -> Bool -> Bool 
a || b= if a then True else b 


类 族 ord 中 方法 的 缺 省 定义 相互 人 依赖， 所以， 在 定义 该 类 族 的 任何 实例 时 ， 必 须 至 
少 给 出 一 种 方法 的 具体 定义 才 可 以 打破 这 种 循环 依赖 (不 同 的 是 ，Eq 中 只 有 (/= ) 有 缺 省 
定义 )。 类 族 ord 需要 Eq 作为 它 的 超 类 族 (superclass) ， 因 为 它 的 4 个 比较 方法 的 缺 省 定 
义 使 用 了 ( == ) 。 

类 族 Show 用 于 显示 结果 。 如 果 一 个 结果 的 类 型 不 是 Show 的 成 员 ， 那 么 Haskell 不 能 
显示 这 种 计算 结果 。2. 5 节 将 进一步 解释 这 个 类 族 。 


2.5 打印 值 
先 看 一 个 谜 题 ; 


ghci> "nHello"++'"\n'++ "young" 二 十 Nn" 二 十 Hovers' 
"Hello\nyoung\nlovers" 


噢 ,我 们 想 要 的 是 


Hello 
young 
lovers 


为 什么 Haskell 没有 打印 出 这 个 结果 ?其 原因 是 ，Haskell 对 一 个 合式 表达 式 求 值 后 ， 将 
show 应 用 于 该 值 ， 生 成 一 个 可 以 在 终端 打印 的 字符 串 。 将 show 应 用 于 一 个 值 v 生成 一 
个 字符 串 ， 该 字符 串 打 印 时 看 上 去 恰好 像 vY。 例 如 : 
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show 42 = "42" 

show 42.3 = "42.3" 

Show at EE niat™ 

Show "hello\n" = "\"hello\\n\"" 


打印 结果 需要 使 用 一 个 Haskell 命令 : 


putStrLn :: String -> I0 () 


类 型 IO a 是 一 个 表示 输入 和 输出 计算 的 特殊 类 型 ， 当 这 种 类 型 的 命令 被 执行 时 ，Haskell 
与 外 部 世界 发 生 交 互 ， 最 后 返回 类 型 为 a 的 值 。 如 果 返 回 值 不 重要 ， 如 put strLn， 则 使 
用 零 元 组 的 值 () 。 

所 以 ，Haskell 统一 使 用 生成 和 输出 (show-and-put) 的 策略 打印 值 。 因 为 前 面 的 谜 题 


中 ， 要 打印 的 值 已 经 是 一 个 串 ， 所 以 可 以 省 略 生 成 步 又， 直接 打印 输出 : 
ghci> putStrLn ("Hello ++"\n"++ "young" ++"\n"++ "lovers") 
Hello 
young 
lovers 


Haskell 提供 许多 其 他 的 输入 和 输出 命令 ， 如 读 写 文件 命令 、 显 示 图 形 命令 ， 等 等 。 
这 些 命令 的 顺序 必须 正确 书写 ， 为 此 Haskell 提供 了 一 种 特殊 的 记号 ， 称 为 do 记 法 。 命 令 
的 内 容 是 第 10 章 的 主题 ， 下 面 仅 介绍 一 点 粗浅 知识 。 

作为 一 个 例子 ， 考 虑 第 1 章 的 高 频 词 问题 ， 其 中 曾 定义 了 函数 : 


commonWords :: Int -> String -> String 


使 得 commonWords n 可 应 用 于 一 个 文本 串 ， 然 后 返回 文本 中 个 出 现 最 多 的 词 表 ， 并 用 一 
个 串 表示 之 。 下 列 程序 从 一 个 文件 读 出 文本 ， 然 后 将 结果 写 入 为 一 个 文件 。 类 型 FilePath 
是 字符 列表 的 为 一 个 同义词 : 


cwords :;: Int -> FilePath -> FilePath -> I0() 
cwords n infile outfile 
= do {text <- readFile infile; 
writeFile outfile (commonWords n text) ; 
putStrLn "cwords done!"} 


例如 ， 对 下 列 式 子 求 值 : 


ghci> cwords 100 "c:\\WarAndPeace" "c:\\Results" 


在 一 个 Windows 平台 上 的 结果 是 读 出 文件 c: \WarAndPeace， 然 后 结果 写作 c:\Re- 
sults。 程 序 还 在 终端 打印 一 个 信息 。 

以 上 定义 中 的 两 个 分 函数 具有 下 列 类 型 : 

readFile :: FilePath -> I0 String 

writeFile :: FilePath -> String -> I0 () 
假设 不 想 用 交互 的 方式 调用 cworas ， 而 是 想 作为 一 个 独立 程序 运行 。 方 法 是 定义 一 个 类 
型 为 IO () ， 标 识 为 main 的 值 。 下 面 是 这 样 的 一 个 程序 : 


main 
= do {putStrLn "Take text from where:'"; 
infile <- getLine; 
PutStrLn "How many words:"; 


油 
tb 
地 
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n <- getLine ; 

PutStrLn "Put results where:"; 

outfile <- getLine,; 

text <- readFile infile; 

writeFile outfile (commonWords (read n) text); 
PutStrLn "cwords done!" } 


关于 read 的 解释 参见 习题 H。 假 设 高 频 词 程序 脚本 存储 在 文件 cwords . 1hs 中 。 
现在 可 以 用 GHC， 即 格拉 斯 哥 Haskell 编译 需 (Glasgow Haskell Compiler) 进行 编译 : 


$ ghc cwords .1hs 


编译 后 的 程序 存储 在 文件 cwords .exe 中 。 在 Windows 下 运行 程序 ， 可 键 人 : 


$ cwords 


然后 遵照 程序 提示 进行 。 


2.6 模块 


假设 函数 commonwords 非常 有 用 ， 我 们 想 在 其 他 脚本 中 也 能 够 使 用 它 。 为 此 ， 需 要 
将 高 频 词 脚本 转变 成 一 个 模块 (module) 。 首 先 ， 将 脚本 如 下 改写 : 


module CommonWords (commonWords) where 
import Data.Char (toLower) 
import Data.List (sort,words) 


commonWords :: Int -> String -> String 


模块 声明 关键 字 module 后 接 模 块 名 ， 而 且 模 块 名 必须 以 大 写字 母 开 头 。 此 外 ， 该 脚 
本 必须 存储 在 名 为 CommonWords .1hs 的 文件 中 ， 以 便 Haskell 能 够 找到 该 模块 〈 至 少 在 
使 用 文学 编程 的 情况 下 ， 和 否则 要 命名 为 CommonwWords .hs )。 模 块 名 后 是 一 个 出 口 
(export， 或 称 输出 ) 的 列表 ， 这 些 出 口 包 括 该 模块 输出 给 其 他 脚本 的 函数 、 类 型 和 其 他 
值 。 出 口 列表 必须 用 圆 括 号 括 起 来 。 这 个 例子 中 只 输出 一 个 函数 commonWords 给 其 他 脚 
本 。 一 个 模块 中 的 出 口 是 该 模块 在 其 他 模块 中 唯一 可 见 的 对 象 。 如 果 省 略 出 口 列 表 和 圆 括 
号 ， 那 么 模块 中 的 所 有 对 象 都 成 为 出 口 。 

定义 模块 后 ， 使 用 下 面 的 声明 可 以 将 模块 输入 到 其 他 脚本 ， 然 后 用 GHC 编译 模块 。 


import CommonWords (commonWords) 


Haskell 模块 有 两 个 主要 优点 。 一 个 优点 是 程序 员 可 以 把 脚本 中 相关 函数 分 在 一 个 小 
组 ， 形 成 独立 模块 ， 从 而 可 以 将 脚本 组 织 成 适当 大 小 的 块 。 另 一 个 优点 是 在 编译 模块 中 的 
函数 被 编译 成 了 特定 的 机 器 代码 ， 从 而 使 得 表达 式 化 简 更 顺畅 ， 所 以 函数 的 求 值 要 快 得 
多 。GHCi 是 一 个 解释 器 (interpreter) ， 不 是 编译 器 ; 解释 器 对 更 接近 于 源 语言 Haskell 的 
表达 式 内 部 形式 求 值 。 


2.7 Haskell 版 面 


do 记 法 的 例子 使 用 了 花 括号 ({}) 和 分 号 〈; )， 这 些 符 写 是 显 式 版 面 (explicit layout) 
的 例子 。 花 括号 和 分 号 只 是 用 来 控制 版 面 ， 除 此 之 外 在 Haskell 表达 式 中 没有 其 他 意义 。 
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这 些 符号 也 可 以 用 于 其 他 位 置 : 


roots :: (Float ,Float ,Float) -> (Float,Float) 
roots (a,b,c) 


| a == 0 = error "not quadratic" 
1 disc < © = error "complex roots" 
| otherwise = ((-b-r)/e, (-b+r)/e) 


Where {disc = b*b - 4*a*c; r = sqrt disc; e = 2*a} 


这 里 的 where 子 句 显 式 地 使 用 了 花 插 号 和 分 号 ， 没 有 使 用 Haskell 的 版 面 规则 。 使 用 
版 面 规则 可 以 如 下 书写 : 
where disc = b#b 一 4*a*Cc 
3 = sqrt disc 
所 = 2*a 


Where disc = b*b 一 4*a*c 
r= sqrt disc 
e = 2*a 


每 当 关键 字 where 或 者 do (以 及 let) 后 的 左 花 括号 被 省 略 时 ， 版 面 (或 者 越位 
(offside) ) 规则 便 起 作用 了 。 此 时 ， 关 键 字 后 的 式 子 ， 无 论 是 在 同一 行 还 是 下 一 行 ， 其 位 
置 被 系统 记 下 。 对 于 后 面 的 每 一 行 ， 如 果 进 一 步 缩 进 ， 则 认为 是 前 一 式 子 的 延续 ;如果 缩 
进 相同 ， 则 认为 是 一 个 新 表达 式 的 开始 ; 如果 缩 进 比 记 下 的 更 少 ， 则 这 部 分 版 面 结束 。 至 
少 越位 规则 大 致 如 此 。 

越位 规则 说 明了 类 族 和 实例 声明 中 的 缩 进 原因 : 

我 也 是 

现在 类 族 声明 结束 。 

如 果 对 规则 存疑 ， 总 是 可 以 使 用 花 括号 和 分 号 代 蔡 规则 。 事 实 上 ， 越 位 规则 在 do 记 
法 中 仍然 可 能 引起 混淆 。 所 以 ， 建 议 使 用 安全 带 ， 即 花 括号 和 分 号 。 

确实 ， 足 球场 上 的 越位 规则 是 复杂 的 。 


2.8 习题 


习题 A 这 是 关于 优先 级 的 问题 ， 来 目 英 国 卫 报 的 Chris Maslanka 的 谜 题 版 : 

“2 加 2 的 一 半 等 于 2 还 是 等 于 3?” 

习题 B 下 面 的 表达 式 中 有 些 是 语法 不 正确 的 ; 有 些 是 语法 正确 的 ， 但 是 不 具有 合理 
的 类 型 。 有 些 是 合式 。 请 识别 出 它们 。 如 果 是 合式 表达 式 ， 请 给 出 适当 的 类 型 。 假 设 
double :: Int -> Int。 建 议 读者 不 使 用 计算 机 查看 答案 ， 但 是 如 果 使 用 的 话 ， 会 看 
到 一 些 奇怪 的 错误 信息 。 

这 些 表 达 式 如 下 : 


[0 ,1) 

double -3 
double (-3) 
double double 0 


_36 | 


26 第 2 章 


if 1==0 then 2==1 

[0 CO Wi 

LE LE EEDI 

concat [tona" "Tor", 2'] 

concat ["tea", "for","2"] 

习题 C ”在 过 去 美好 的 日 子 里 ,作者 写 论文 可 以 用 这 样 的 标题 : 

“The morphology of prex- an essay in meta- algorithmics” 

但 是 ， 现 在 的 杂志 和 而 望 所 有 词 用 大 写 开 头 : 

“The Morphology Of Prex- An Essay In Meta-algorithmics 

请 设计 一 个 图 数 modernise :: String -> String， 确 保 论 文 标题 满足 如 上 要 
求 。 下 面 先 回答 一 些 有 帮助 的 问题 : 

1. 图 数 toLower :: Char -> Char 是 将 字母 转换 为 小 写 的 图 数 。 你 认为 标准 引导 
库 中 将 字母 转换 为 大 写 的 函数 名 是 什么 ? 

2. 函数 word : : String -> [Word] 曾 在 第 1 章 使 用 过 。 你 认为 下 列 引 导 库 函数 的 
作用 是 什么 ? 


unwords :: [Word] -> String 


提示 : 如 果 下 列 方程 中 有 一 个 成 立 的 话 ， 哪 个 成 立 ? 


words . unwords = id 
unwords . words = id 


3. 限 数 head :: [al -> a 返回 非 空 列表 的 第 一 个 元 素 ,，tail :: [al -> [a] 返 
回 一 个 列表 去 除 第 一 个 元 素 后 的 尾部 列表 。 如 果 已 知 一 个 列表 的 第 一 个 元 素 是 x， 尾部 是 
xs， 如 何 构造 该 列表 ? 

习题 D ”Beaver 是 勤奋 求 值 器 ，Susan 是 惰性 求 值 器 ” 。 如 果 xs 是 长 度 为 n 的 列表 ， 
在 计算 head (map f xs) 时 Beaver 会 计算 £ 多 少 次 ? Susan 会 计算 多 少 次 ?” Beaver 更 喜欢 
head . map f 的 哪 种 形式 ? 

哨 数 filter p 对 一 个 列表 过 滤 ， 返 回 满足 布尔 条 件 测 试 p 的 元 素 构 成 的 列表 。 
filter 的 类 型 为 


filter :: (a -> Bool) -> [a] -> [a] 


Susan 喜欢 用 郴 数 head . filter p 找 出 列表 中 第 一 个 满足 p 的 元 素 。 为 什么 Berver 
不 用 同样 的 表达 式 ? 相反 ，Beaver 可 能 定义 这 样 的 函数 : 


firet :: (a => Bool) ~> [al 二 > & 

first p xs | null xs = error "Empty list" 
1 多 六 ny 
| otherwise = ... 
where x = head xs 


限 数 null 对 于 空 列 表 返 回 True， 非 空 列表 返回 False。 对 Beaver 的 函数 求 值 时 ， 
表达 式 error message 终止 求 值 过 程 ， 并 在 终端 打印 串 message， 所 以 结果 是 上 。 请 
完成 Beaver 定义 中 右边 部 分 。 


加 ”如 果 读 者 不 清楚 这 里 的 含义 ， 请 谷歌 “lazy susan” 查 看 其 含义 。 
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Beaver 可 能 更 喜欢 head . filter p . map f 的 哪 种 形式 ? 
习题 E 类 型 Maybe 在 标准 引导 库 中 定义 如 下 : 


data Maybe a = Nothing | Just a 
deriving (Eq, Ord) 


该 定义 使 用 了 一 个 deriving (导出 ) 子 句 。 对 于 某 些 数据 声明 ，Haskell 可 以 为 它 
们 上 自动 生成 一 些 标准 类 族 的 实例 。 对 于 目前 的 例子 ， 导 出 子 句 意味 着 程序 员 无 需 键 人 下 列 
见 繁 的 定义 : 
instance (Eq a) => Eq (Maybe a) 
Nothing == Nothing = True 
Nothing == Just y = False 


Just x == Nothing = False 
Just x == Just y = (x == y) 


instance (0rd a) => Ord (Maybe a) 
Nothing <= Nothing = True 
Nothing <= Just y = True 
Just x <= Nothing = False 
Just x <= Justy = (x <= y) 


定义 中 Nothing 小 于 Just y 的 原因 只 是 因为 在 Maybe 的 数据 声明 中 ,构造 函数 
Nothing 写 在 Just 之 前 。 

Maybe 类 型 提供 了 处 理 失败 的 系统 方法 ， 所 以 这 个 类 型 非常 有 用 。 再 考虑 前 面 习 题 
中 的 函数 : 


first p = head . filter p 


勤奋 的 Beaver 和 懒散 的 Susan 都 有 该 明 数 各 自 的 版 本 ， 而 且 当 把 first p 应 用 于 一 
个 空 列表 时 都 终止 执行 ， 并 返回 一 个 错误 信息 。 这 个 结果 并 不 圆满 。 更 好 的 方法 是 定义 : 


first :: (a -> Bool) -> [a] -> Maybe a 


现在 如 果 列 表 中 没有 元 素 满足 测试 条 件 ， 可 以 通过 返回 Nothing 很 圆满 地 处 理 失 败 
的 情况 。 

请 给 出 这 个 first 版 本 的 定义 。 

最 后 ， 计 算 Haskell 中 类 型 为 Maybe a ->Maybe a 的 函数 个 数 。 

习题 F 下面 是 一 个 计算 x 的 nn 次 方 的 函数 ， 其 中 二 0。 


exp :: Integer -> Integer -> Integer 
exp xn|n==0 = 1 

| n == 1 = Xx 

| otherwise = x*exp x (n-1) 


请 问 计 算 exp xn 需要 做 多 少 次 乘法 ? 
一 个 聪明 的 程序 员 Dick 声称 他 可 以 用 次 数 少 得 多 的 方法 计算 exp x n: 


expxn|ln==0 =1 
| n==1 =x 
| even n = ... 
| dd A 


请 完成 定义 ， 并 计算 用 Dick 的 方法 对 表达 式 exp x n 求 值 需要 做 多 少 次 乘法 ， 这 里 
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假定 22 过 mnm<22+ 。 
习题 G 假设 日 期 用 3 个 整数 表示 成 (day，month，year)。 请 定义 一 个 函数 
showDate :: Date -> String 使 得 日 期 能 够 像 下 面 例子 一 样 显示 : 


showDate (10,12,2013) = "10th December, 2013" 

showDate (21,11,2020) = "21ist November, 2020" 

读者 应 该 明日 Int 是 类 族 Show 的 实例 ， 所 以 show n 生成 十 进 制 整数 n 的 串 表 示 。 

习题 H 信用 卡 公司 Foxy 发 行 卡号 (CIN) 为 10 位 数字 的 信用 卡 ， 前 8 位 是 任意 的 ， 

但 是 最 后 两 位 表示 的 整数 是 前 8 位 数字 之 和 的 验证 码 。 例 如 ，“6324513428” 是 一 个 合法 
的 CIN， 因 为 前 8 位 数学 之 和 是 28。 

请 构造 一 个 函数 addsum :: CIN -> CIN, 它 将 8 位 数字 组 成 的 串 转换 为 包含 其 验 
证 码 的 10 位 数字 的 串 。 因 此 ，cIN 是 String 的 同义词 ， 不 过 字符 限制 为 数字 。 注 意 ， 
Haskell 类 型 同义词 不 能 强制 这 样 的 类 型 约束 。 读 者 需要 实现 一 个 数字 字符 和 对 应 数值 之 
间 的 转换 。 其 中 一 个 方向 的 转换 很 简单 : 只 需 使 用 show。 男 一 个 方向 的 转换 也 很 简单 : 

getDigit :: Char -> Int 

getDigit c = read [c] 

图 数 read 是 类 族 Read 的 方法 ， 其 类 型 为 


read :: Read a => String -> a 


类 族 Read 是 Show 的 对 偶 ，read 也 是 show 的 对 偶 。 例 如 : 


ghci> read "123" :: Int 
123 

ghci> read "123" :: Float 
123.0 


使 用 函数 reag 时 必须 提供 结果 的 类 型 。 任 何 时 候 都 可 以 用 这 种 方法 给 表达 式 添加 类 
型 注释 (type annotation ) 。 

现在 请 构造 一 个 函数 valiq :: CIN ->Bool 检查 一 个 卡号 是 否 合 法 。 函 数 take 
在 这 里 可 能 有 帮助 。 


习题 1 根据 定义 ， 一 个 回 文 (palindrome) 是 这 样 的 字符 串 : 如 果 忽 略 标点 符号 、 
格 和 字母 的 大 小 写 ， 那 么 正念 和 反 念 结果 是 一 样 的。 请 设计 一 个 交互 式 程序 : 


palindrome :: I0 () 


运行 该 程序 将 引导 出 一 个 交互 会 话 ， 例 如 : 
ghci> palindrome 

Enter a string: 

Madam, I'm Adam 

Yes! 


ghci> palindrome 

Enter a string: 

A Man, a plan, a canal - Suez! 
No! 


ghci> palindrome 

Enter a string: 

Doc, note I dissent. A fast never prevents a fatness. 
I diet on cod. 

Yes! 
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其 中 函数 isAlpha :: Char ->Bool 检测 一 个 字符 是 否 为 字母 ， 函 数 reverse :: 
[a] -> [al] 将 列表 反 转 。 函 数 reverse 在 标准 引导 库 中 定义 ,函数 isAlpha 可 以 从 库 
Data .Char 中 输入 。 


2.9 答案 


习题 A 答案 Maslanka 迹 题 的 答案 是 “可 能 等 于 2 也 可 能 等 于 3”。 这 个 小 谜 题 难 倒 
了 不 少 杰 出 的 计算 机 科学 家 。 
习题 B 答案 CHCi 会 话 显 示 (附加 解释 ): 


ghci> :type [0,1) 
<interactive>:1:5: parse error on input “) 


虽然 GHCi 没有 聪明 地 指出 应 该 使 用 ' ] ' ， 但 是 它 明 日 ' ) ' 是 错误 的 。 


ghci> :type double -3 

<interactive>:1:9: 

No instance for (Num (Int -> Int)) 

arising from the literal “3' 

Possible fix: add an instance declaration for 
(Num (Int -> Int)) 

In the second argument of “(-)', namely “3' 

In the expression: double - 3 


错误 信息 解释 说 ， 数值 减法 ( 一 ) 的 类 型 是 Numa = 三 > a -> do 藻 要 使 得 double = 过 
是 合法 表达 式 (题目 中 写 的 是 Gouble -3, 但 是 空格 在 这 里 不 重要 ) ，double 必须 是 
一 个 数 ， 所 以 需要 类 族 实例 Num (Int -> Int)。 但 是 , 不 存在 这 样 的 实例 定义 ， 所 以 
一 个 函数 减 去 一 个 数 无 意义 。 

ghci> double (-3) 

~ 和 

ghci> double double 0 

<interactive>:1:1: 

The function “double' is applied to two arguments, 

but its type “Int -> Int' has only one 


In the expression: double double 0 
In an equation for “it': it = double double 0 


大 多 GHCi 错误 信息 的 含义 是 清楚 的 。 
ghci> if 1==0 then 2==1 


<interactive>:1:18: 
parse error (possibly incorrect indentation) 


条 件 表 达 式 缺少 else 子 句 ， 因 此 不 完整 。 


ghci> LP 
True 


两 边 都 是 合式 表达 式 ， 而 且 表 示 同 一 个 列表 。 


ghci> [(+),(-)] 

<interactive>:1:1: 

No instance for (Show (a0 -> a0 -> a0)) 
arising from a use of “print' 
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Possible fix: 
add an instance declaration for 
(Show (a0 -> a0 -> a0)) 
In a stmt of an interactive GHCi command: print it 


要 显示 值 [( +)，,( -)]， 首 先 要 能 够 显示 其 元 素 。 但 是 ,不 存在 显示 函数 的 方法 。 


ghci> :type [U,[U],[LUJ]J] 
【器 有 人 LO SEE 


为 了 解释 这 个 类 型 ， 先 假定 主 列表 的 类 型 是 [pb] 。 主 列表 的 第 一 个 元 素 是 列表 ， 所 以 
b = [c]; 第 二 个 元 素 是 列表 的 列表 , 故 c = [9a]; 第 三 个 元 素 是 列表 的 列表 的 列表 ， 故 
dl. = [al O 〇 


ghci> concat ["tea","for",'2'] 

<interactive>:1:21: 

Couldn't match expected type “ [Char]' 

with actual type “Char' 

In the expression: '2' 

In the first argument of “concat', 

namely “ ["tea", Por +197] 

In the expression: concat ["tea", "for", '2'] 

列表 的 前 两 个 元 素 具 有 类 型 [char] ,但 是 最 后 一 个 元 素 的 类 型 是 char ， 所 以 这 种 
列表 是 不 合法 的 。 


ghci> concat ["tea","for","2"] 
"teafor2" 


习题 C 答案 

1. 当然 是 toUpper。 

2. 将 词 串 接 ， 并 在 词 之 间 加 一 个 空格 。 男 外 ，word . unword = id 成 立 ; 但 是 
unword . word = id 不 成 立 。 

3 [XxX] ++ KHs 


modernise :: String -> String 
modernise = unwords . map capitalise . words 


capitalise :: Word -> Word 
capitalise xs = [toUpper (head xs)] ++ tail xs 


第 4 章 将 给 出 capitalise 的 另 一 种 定义 。 

习题 D 答案 ”使 用 勤奋 求 值 方法 计算 head (map f xs ) 需要 对 f 计算 nn 次, 但 是 使 
用 惰性 求 值 只 需 对 f 计算 一 次 。Beaver 必须 使 用 恒等式 head . map E = f. head。 

Beaver 不 使 用 定义 first p = head . filter p， 而 是 可 能 定义 : 


first :: (a -> Bool) -> [a] -> a 
first p xs | null xs = error "Empty list" 
上 :二 = xX 


| otherwise = first p (tail xs) 
Where x = head xs 


Beaver 不 使 用 定义 first pf = head . filter p . map f， 而 是 可 能 定义 : 


first :: (b -> Bool) -> (a -> b) -> [a] -> Pb 
first pf xs | null xs = error "Empty list" 
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| : 屯 工 = XxX 
| otherwise = first p f (tail xs) 
Where x = f (head xs) 


问题 的 关键 是 ， 用 勤奋 求 值 策略 时 ， 大 多 数 函 数 必须 用 显 式 递归 定义 ， 而 不 是 利用 像 
map 和 filter 这 样 的 图 数 定义 。 
习题 E 答案 ”懒散 的 Susan 可 能 会 定义 : 


first p xs = if null ys then Nothing 
else Just (head ys) 
Where ys = filter p xs 


类 型 为 Maybe a -> Maybe a 的 因数 共有 4 个 : 


fi x = case XxX of Nothing -> Nothing; Just Vv -> Just v 

f2 x = case x of Just v -> JUust Vv 

f3 x = case x of Nothing -> Just undefined; Just Vv -> Just V 
f4 x = Just (case x of Nothing -> undefined; Just v -> V) 


习题 F 答案 对 exp x n 求 值 需要 n -1 次 乘法 。Dick 的 方法 是 利用 恒等式 x”= 
(x )” 和 x””=x(x )” 得 到 递归 定义 : 


exp x 了 
|n==0 =1 
| n==1 =x 
| even n = exp (x*x) mn 


| odd n = x*exp (x*x) m 
Where m= nn “div. 2 


这 是 分 治 法 (divide and conquer) 算法 的 一 个 例子 。 使 用 Dick 的 方法 计算 exp xn 最 
多 需要 2| logn | 次 乘法 ， 其 中 Lx j」 表 示 一 个 数 的 底 ， 即 不 大 于 该 数 的 最 大 整数 。 第 3 章 将 
进一步 讨论 取 底 函数 。 


习题 G 答案 
showDate :: Date -> String 
showDate (d,m,y) = show d ++ suffix d ++ " "++ 


months !! (m-1) ++ ", " ++ Show y 


阴 数 suffix 计算 数字 的 右 后 级 : 


suffix d = if d==1 || d==21 || d==31 then "st'" else 
if d==2 || d==22 then "nd'" else 
if d==3 || d==23 then "rd" else 


"th" 
months = ["January",....... ] 
如 果 读 者 乐于 找到 suffix 的 聪明 计算 法 ， 那么 读者 应 该 明白 : 有 时 候 简 单 的 解 就 是 


最 好 的 解 。 
习题 H 答案 一 个 解 是 


addSum :: CIN -> CIN 

addSum cin = 
cin ++ Show (n ‘div 10) ++ Show (n ‘mod 10) 
where n = sum (map fromDigit cin) 


Valid :: CIN -> Bool 
valid cin = cin == addSum (take 8 cin) 








fromDigit :: Char -> Int 
fromDigit c = read [c] 
函数 fromDigit 返回 一 个 字符 的 对 应 数字 。 

习题 | 答案 下 面 是 一 个 解 : 

import Data.Char (toLower,isAlpha) 
palindrome :: I0() 
palindrome 

= do {putStrLn "Enter a string:"; 

xs <- getLine ; 


if isPalindrome xs then PutStrLn "Yes!" 
else putStrLn "No!"} 


isPalindrome :: String -> Bool 
isPalindrome xs = (ys == reverse ys) 
where ys = map toLower (filter isAlpha xs) 


2. 10 ” 注 记 


本 章 多 次 提 到 Haskel “标准 引导 库 ”， 该 库 包 含 许 多 程序 设计 不 可 缺少 的 基本 的 类 
型 、 类 族 、 函 数 和 值 。 关 于 标准 引导 库 的 完整 说 明 ， 请 参看 Haskell 报告 第 8 章 ; 或 者 访 
问 下 列 链接 : 

www. haskell. org/ onlinereport/ standard- prelude. html 

关于 函数 程序 语言 ， 特 别 是 Haskell 的 实现 ， 更 多 信息 参看 www. haskell. org。 早 期 由 
Simon Peyton Jones 编写 的 《The Implementation of Functional Programming languages》 (Pren- 
tice Hall ，1987) 一 书 已 经 不 再 版 ， 但 是 可 以 从 下 列 链接 找到 在 线 版 : 

research. microsoft. com/~ simonpj/papers/slpj-book-1987 

除 GHC 外 ，Haskell 还 有 其 他 保持 维护 的 编译 亿 ， 包 括 UHC ( Utrecht Haskell Compiler)， 
参见 官网 cs. uu. nl/wikiUHC 。 

关于 勤奋 求 值 和 惰性 求 值 的 比较 ,请 参考 Bob Harper 的 博客 文章 “The point of lazi- 
ness”， 可 以 在 下 列 链接 找到 : 

existentialtype. wordpress. com/2011/04/24/ 

在 博文 中 Harper 列举 了 他 偏爱 严格 语言 的 一 些 理由 。 也 请 阅读 Lennart Augustsson 的 
回复 。Augustsson 的 主要 观点 是 ， 如 习题 D 中 所 强调 ， 在 严格 求 值 策略 下 ， 为 了 提高 效 
率 ， 大 部 分 函数 必须 用 显 式 递归 的 方式 定义 ， 这样 便 失 去 了 使 用 简单 标准 函数 定义 新 函数 
的 能 力 。 这 样 前 弱 了 使 用 组 成 函数 的 通用 定律 对 函数 进行 推理 的 能 力 。 

Bob Harper 是 《The Definition of Standard ML (Revised)》 (MIT Press，1989) 的 作者 
之 一 。ML 是 一 种 严格 语言 。 读 者 可 以 在 下 列 链 接 找到 有 关 ML 的 介绍 : 

www. cs. cmu. edu/ ~ rwh/ smlbook/ book. pdf 

男 一 种 越 来 越 受 欢迎 的 语言 是 Agda， 它 既是 一 种 依存 类 型 函数 语言 ， 也 是 一 个 证 明 
辅助 融 ， 请 参见 Agda 官网 : 

wiki. portal. chalmers. se/agda/ pmwiki. php 

Chris Maslanka 是 英国 《 卫 报 》 的 周 六 版 专栏 作家 。 
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Thinking Functionally with Haskell 


数 





Haskell 中 的 数 比 较 复 杂 ， 因 为 Haskell 世界 有 许多 不 同类 型 的 数 ， 包 括 ; 

Int 有 限 精度 整数 ， 至 少 包 含 范 围 [ -2” ，2”) ， 整 数 滋 出 不 被 检测 
Integer 任意 精度 整数 

Rational 任意 精度 有 理 数 


Float 单 精 度 浮 点 数 
Double 双 精 度 浮 点 数 
Compl ex 复数 (定义 在 Data .Complex 中 ) 


大 多 数 程序 以 各 种 方式 使 用 数 ， 所 以 必须 理解 Haskell 提供 了 哪些 数 ， 以 及 这 些 不 同 
类 型 的 数 如 何 转换 。 这 便 是 本 章 讨 论 的 内 容 。 
3.1 类 族 Num 

Haskell 的 所 有 数 都 是 类 族 Num 的 实例 


class (Eq a, Show a) => Num a where 


(Cra Si >a 
negate 5 和 和 玫 
abs, signum :: a -> a 
fromInteger :: Integer -> a 


类 族 Num 是 类 族 Eq 和 Show 的 子 类 族 。 这 表示 每 个 数 都 可 以 被 打印 ， 任 意 两 个 数 都 
可 以 比较 是 否 相 等 ， 任 意 数 都 可 以 与 另 一 个 数值 相 加 、 相 减 和 相 乘 ， 任 意 数 都 可 以 取 反 。 
Haskell 允许 用 - x 表示 negate x， 这 也 是 Haskell 中 唯一 的 一 个 前 缀 运算 符 。 

阴 数 abs 和 signum 返回 一 个 数 的 绝对 值 和 符号 。 如 果 人 允许 在 Num 中 有 次 序 运 算 
(实际 上 在 Num 中 没有 次 序 运 算 ， 因 为 复数 不 能 排序 ) ， 那 么 就 可 以 定义 : 


abS x = if x < 0 then -x else x 
signum x | x<0 = -1 
|x==0=0 
| 学 有 是 


因数 EromInteger 是 一 个 转换 函数 。 一 个 整数 值 如 42 表示 fromInteger 在 类 型 
Integer 的 一 个 适当 值 上 的 应 用 ， 所 以 这 样 的 数字 具有 类 型 Num a => ae 待 下 面 介绍 
了 数 的 其 他 类 族 和 类 族 之 间 的 转换 后 再 来 介绍 这 种 选择 。 


3.2 其 他 数值 类 族 
类 族 Num 有 两 个 子 类 族 一 一 实数 和 分 数 : 


class (Num a,0rd a) => Real a where 
toRational :: a -> Rational 
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class (Num a) => Fractional a where 
(/) :: a -> a ->a 
fromRational :: Rational -> a 


实数 可 以 比较 大 小 。 类 族 Real 除了 从 超 类 族 ord 继承 的 比较 运算 外 ， 只 有 一 个 新 的 
方法 ， 即 该 类 族 元 素 到 Rational 元 素 的 转换 图 数 。 类 型 Rational 本 质 上 是 整数 对 的 
同义词 。 实 数 7 不 是 有 理 数 ， 所 以 toRational 只 能 将 其 转换 成 一 个 近似 的 有 理 数 : 


ghci> toRational pi 
884279719003555 % 281474976710656 


并 不 像 22 % 7 那样 好 记 ， 但 是 更 精确 。 符 号 % 用 来 分 离 一 个 有 理 数 的 分 子 和 分 母 。 
分 数 是 定义 了 除法 的 数 的 集合 。 一 个 复数 不 可 能 是 实数 ， 但 可 以 是 分 数 。 一 个 浮 点 数 
如 3. 149 表示 fromRational 在 某 个 适当 的 有 理 数 上 的 应 用 。 所 以 


3.149 :: Fractional a => a 


这 个 类 型 和 前 面 的 和 2 的 类 型 Num a => a 解释 了 为 什么 可 以 构造 像 42 + 3 .149 这 样 一 
个 整数 和 一 个 浮 点 数 相 加 的 合法 表达 式 。 两 个 类 型 都 是 类 族 Num 的 成 员 ， 而且 所 有 的 数 
都 可 以 相 加 。 考 虑 


ghci> :type 42 + 3.149 
42 + 3.149 :: Fractional a => a 


这 表示 相 加 的 结果 还 是 一 个 分 数 。 
实数 的 一 个 子 类 族 是 整 型 数 ， 该 类 族 的 简化 定义 如 下 : 


class (Real a, Enum a) => Integral a where 
divMod :: a -> a -> (a,a) 
toInteger :: a -> Integer 
类 族 Integral 是 Enum 的 一 个 子 类 族 ， 而 Enum 的 类 型 是 其 元 素 可 以 顺序 枚 举 的 类 
型 。 每 个 整 型 数 可 以 用 toInteger 转换 为 一 个 Integer。 这 也 说 明 可 以 用 两 步 将 一 个 
整 型 数 转换 为 任意 其 他 类 型 : 


fromIntegral :: (Integral a, Num b) => a -> b 
fromIntegral = fromInteger . toInteger 


运算 divMod 返回 两 个 值 : 

x “div y = fst (x "divMod”y) 

x “mod y = snd (x “divMod、 y) 

标准 引导 库 函 数 fst 和 snd 返回 一 个 二 元 组 的 第 一 个 分 量 和 第 二 个 分 量 : 
fst :: (a,b) -> a 


fst (x,y) = x 


snd :: (a,b) -> Pb 

snd (x,y) = y 

数学 上 ，x div y =| x/y 上 将 在 3.3 节 看 到 如 何 计算 Lx j。x mod y 的 定义 如 下 : 
= (xdivy)*y+x mody 

对 于 整数 x* 和 y, 有 0 <=x'mod'y < vs 

回顾 第 1 章 的 函数 digits2， 当 时 定义 了 


digits2 n = (n div” 10, n mod”1l0) 


更 高 效 的 定义 是 digits2n =n “divMod、10,， 因为 这 里 只 需要 执行 一 次 divMod 运 
算 。 更 简洁 点 ， 可 以 利用 部 分 运算 ， 写 成 digits2 = (“divMod` 10)。 

Haskell 还 有 其 他 的 数值 类 族 ， 包 括 Frational 的 子 类 族 Floating， 其 中 包含 对 数 
国 数 和 三 角 图 数 。 但 是 ， 这 些 已 经 够 用 了 。 


3.3 取 底 函数 的 计算 


值 |Lx j」 表 示 x 的 底 (floor) ， 定 义 为 满足 mx 的 最 大 整数 m。 定 义 一 个 函数 floor :: 
Float -> Integer 计算 数 的 底 。Haskell 在 标准 引导 库 中 提供 了 这 个 函数 ， 不 过 给 出 我 
们 自己 的 定义 有 指导 意义 。 

一 个 叫 Clever Dick (聪明 的 迪克 ) 的 学 生 拿 到 问题 后 给 出 下 面 的 解 : 


floor :: Float -> Integer 
floor = read . takeWhile (/= '.') . show 


用 语言 来 叙述 : 将 输入 的 数 显 示 成 串 ， 截 取 小 数 点 前 的 字 串 ， 然 后 将 结果 读 成 一 个 整数 。 
我 们 还 没有 遇 到 takeWhile， 显 然 Clever Dick 知道 这 个 函数 。Clever Dick 的 解 在 一 些 情 
况 下 是 错 的 ， 习 题 D 要 求 读者 列 出 这 些 情况 。 

我 们 将 借用 一 个 显 式 的 查找 求 一 个 数 的 底 ， 为 此 需要 一 个 循环 : 

nbil 1 (=> Booa) => (a = 0 => a a 

until pf x= if px then x else until p f (f x) 

函数 until 也 是 由 标准 引导 库 提供 的 。 下 面 是 一 个 例子 : 


ghci> until (>100) (*7) 1 
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本 质 上 until f p x 计算 下 列 无 穷 列表 中 满足 py = True 的 第 一 个 元 素 : 


[i 


关于 until 的 精确 解释 参见 第 4 章 。 

现在 考虑 Elooz 的 设计 ， 不禁 想 分 情况 考虑 ， 区 别 x<0 和 x 宕 0 两 种 情况 。 对 于 
x <0， 需 要 在 序列 -1，-2,… 中 找到 满足 m<x 的 第 一 个 整数 m。 由 此 得 到 参数 为 负数 
时 的 定义 : 


floor x = until (leq. x) (subtract 1) (-1) 
Where m “leq x = fromInteger m <= X 


这 个 定义 中 有 几 点 需要 注意 。 第 一 ， 引 导 库 函数 subtract 的 使 用 ， 其 定义 为 
subtract x y = y-x 
必须 使 用 subtract 1 ， 因 为 ( -1) 不 是 部 分 应 用 ， 而 是 数 -1(until 的 第 三 个 参数 ) 。 
第 二 ， 为 什么 使 用 了 `1eq 而 没有 使 用 看 似 完 全 适合 的 (<= )? 答案 是 ( <= ) 具 有 下 
列 类 型 : 


(<=) :: Ord a => a -> a -> Bool 


特别 是 ，( <= ) 的 两 个 参数 具有 相同 的 类 型 。 但 是 想 要 的 是 
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leq :: Integer -> Float -> Bool 


其 中 两 个 参数 具有 不 同 的 数值 类 型 。 因 此 ， 需 要 使 用 fromInteger 将 整数 转换 为 浮 点 
数 。 搞 懂 在 某 些 情况 下 需要 转换 图 数 是 理解 Haskell 算术 的 关键 点 。 

第 三 ， 注意 (`leq` x) 与 (leq x) 不 同 : 

(leq x) y= leqxy 

(leq x) y=Yy leq x= leqyx 
这 里 容易 出 错 。 

如 果 不 喜 欢 辅助 定义 ， 那 么 总 是 可 以 写成 


floor x = until ((<=x) . fromInteger) (subtract 1) (-1) 


在 这 个 定义 中 将 (`leq`x) 定 义 为 内 联 (inlined)。 
接 下 来 需要 处 理 x*=0 的 情况 。 对 于 这 种 情况 ， 需 要 找 出 满足 xz <n+1 的 第 一 个 整数 
nn。 可 以 先 求 出 满足 x <z 的 第 一 个 整数 n， 然 后 再 减 去 1。 由 此 得 到 定义 : 
flo0r X = ntil (x “It ) (+1} 1- 1 
Where x “lt  n = x < fromlnteger n 
将 两 个 定义 合 在 一 起 ， 得 到 
floor x = if x<0 


then until (“leq. x) (subtract 1) (-1) 
else until (x “1t*) (+1) 1 - 1 


(问题 : 为 什么 在 第 一 行 不 必 写 成 x < fromInteger 0?) 这 个 定义 除了 难看 的 分 情况 以 
及 两 种 情况 不 对 称 外 ， 真 正 的 问题 是 效率 很 低 : 计算 结果 大 致 需要 |x| 步 (|*| 是 absx 
的 数学 表示 ) 。 


二 分 查找 


计算 floor 的 更 好 方法 是 首先 找到 满足 mx <n 的 整数 m 和， 然后 将 区 间 (m， 
n) 缩减 成 包含 x 的 单位 区 间 (满足 m+1 =n 的 区 间 )。 此 时 ， 返回 区 间 的 左边 界 作 为 结 
果 。 由 此 得 到 


floor :: Float -> Integer 
floor x = fst (until wit (shrink x) (bound x)) 
Where unit (m,n) = (m+l == n) 


其 中 的 值 bound x 是 满足 mx <n 的 一 个 二 元 组 (m,n)。 如 果 区 间 (m,n) 不 是 单位 
区 间 ， 则 shrink x (m,n) 返 回 一 个 严格 小 于 原 区 间 并 仍然 包含 x 的 新 区 间 。 

首先 考虑 如 何 缩减 一 个 包含 x 的 非 单位 区 间 ， 即 m<x <n。 假设 p 是 满足 m<p <n 的 
任意 整数 。 这 样 的 p 一 定 存 在 ， 因 为 (m,n) 不 是 单位 区 间 。 然 后 定义 : 

type Interval = (Integer,Integer) 

shrink :: Float -> Interval -> Interval 


shrink x (m,n) = if p ‘leq x then (p,n) else (m,p) 
where p = choose (m,n) 


如 何 定 义 choose 呢 ? 两 种 选择 是 choose (m,n) =m+l 和 choose (m,n) =n-1, 
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因为 两 者 者 减 小 区 间 长 度 。 但 是 ， 更 好 的 选择 是 


choose :: Interval -> Integer 
choose (m,n) = (m+n) “div” 2 


使 用 这 个 选择 ， 每 一 步 区 间 的 长 度 减 半 ， 而 不 是 减 1。 但 是 ,需要 检查 在 m+1 关 n 的 情况 
下 m< (m+n)div2<n 成立。 推理 如 下 : 
m< (m+n)div2 <n 
三 | 整数 的 序 关系 | 
m+l<(m+n)div2 <n 
三 | 因为 (m +n)div2 =|[(m +n)/2 
m+l<(m+n)/2<n 
三 | 算术 | 
m+2<nAm<n 
三 | 算术 | 
mt+l<n 
最 后 ， 如 何 定 义 bounG 呢 ? 可 以 先 定 义 : 


bound :: Float -> Interval 
bound x = (lower Xx, upper xX) 


其 中 值 lower x 是 小 于 或 者 等 于 x 的 某 个 整数 ，upper x 是 大 于 x 的 茶 个 整数 。 比 通过 
线性 搜索 查找 这 些 值 更 好 的 搜索 方法 是 
lower :: Float -> Integer 


lower X = until (‘leq x) (*2) (-1) 


upper :: Float -> Integer 

upper x = until (x “1t*) (*2) 1 
为 了 使 得 bound 高 效 ， 更 好 的 方法 是 每 步 加 倍 ， 而 不 是 仅 加 1 或 者 减 1。 例如， 对 于 x= 
17.3， 仅 需要 7 次 比较 即 可 找到 包围 区 间 ( -1，32) ， 然 后 用 5 步 缩减 到 (17，18)。 实 
际 上 ， 计 算 上 界 和 下 界 总 共 需 要 的 步 数 正 比 于 log | x | ， 整 个 算法 最 多 两 倍 于 这 个 时 间 。 
一 个 对 数 时 间 算 法 比 线性 时 间 算 法 要 快 得 多 。 

标准 引导 库 用 下 列 方法 定义 floor: 


floor x = if r < 0 then n-1 else n 
where (n,r) = properFraction x 


其 中 因数 properFraction 是 类 族 RealFrac (目前 还 没有 讨论 过 的 类 族 ， 其 方法 处 理 
数 的 售 人 ) 的 一 个 方法 ， 它 将 一 个 数 x 分 解 为 整数 部 分 n 和 小 数 部 分 r， 使 得 x =n+r。 现 
在 大 家 明白 了 。 


3.4 自然 数 


Haskell 没有 提供 目 然 数 的 类 型 ， 即 非 负 整数 的 类 型 。 但 是 ， 我 们 目 己 可 以 定义 这 样 
的 拓 型 : 


data Nat = Zero | Succ Nat 
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这 是 一 个 数据 声明 (data declaraion) 的 例子 。 声 明 表 示 ，Zero 是 Nat 的 一 个 值 ， 而 且 当 
n 是 Nat 的 一 个 值 时 ，Succ n 也 是 Nat 的 值 。Zero 和 succ 都 称 为 数据 构造 器 ( data 
constructor) 或 构造 函数 ,而且 要 用 大 写字 母 开 头 。Zero 的 类 型 是 Nat ，Succ 的 类 型 是 
Nat -> Nat。 因 此 ， 下 列 每 一 个 元 素 都 是 Nat 的 元 素 : 


Zero, Succ Zero，Succ (Succ Zero), Succ (Succ (Succ Zero)) 


下 面 考虑 如 何 通 过 将 Nat 设置 为 类 族 Num 的 成 员 来 进行 算术 运算 编程 。 首 先 ， 需 要 
将 Nat 设置 为 Eq 和 Show 的 实例 ; 


instance Eq Nat where 

Zero == Zero = True 

Zero == SuCcCc nn = False 

Succ m == Zero = False 

Succ m == Succ n = (m == n) 

instance Show Nat where 

show Zero = "Zero" 

show (Succ Zero) = "Succ Zero" 

show (Succ (Succ n)) = "Succ (" ++ show (Succ n) ++ ")" 


这 些 定义 使 用 了 模式 匹配 ( pattern matching) 。 特 别 是 ，show 的 定义 利用 了 3 个 模式 : 
Zero、Succ Zero 和 Succ (Succ n)。 这 些 模式 互 不 相同 ,而且 覆盖 了 Nat 除 上 之 外 
的 所 有 元 素 。 

或 者 ， 也 可 以 使 用 下 列 方法 达到 同样 目的 : 


data Nat = Zero | Succ Nat deriving (Eq,0rd,Show) 


如 第 2 章 习 题 所 讲 ， 聪 明 的 Haskell 可 以 自动 生成 某 些 标准 类 族 的 实例 ， 包 括 Eq、ord 
和 Show。 
现在 可 以 定义 Nat 为 数值 类 型 ; 


instance Num Nat Where 
m + Zero = 
m+ Succn = Succ (m+n) 


m * Zero = Zero 
mu* (Succ n) =m* n+m 


abs 1n = 1 
signum Zero = Zero 
signum (Succ n) = Succ Zero 


m ~- Zero 二 了 
Zero - Succ n = Zero 
Succ m - Succ n =m- 1n 


fromlnteger x 


| x <= 0 = Zero 
| otherwise = Succ (fromInteger (x-1)) 


我 们 定义 了 减法 运算 : 如 果 mn， 则 m -n=0。 当 然 ，Nat 上 的 算术 运算 极其 慢 ， 而 且 
每 个 数 都 占用 很 大 的 空间 。 


每 个 类 型 都 包含 值 上 。 因 此 ， 对 于 所 有 类 型 a 有 undefined :: a。 根 据 定 义 Succ 
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是 一 个 非 严 格 函 数 ， 下 列 这 些 值 互 不 相同 ， 而 且 都 是 Nat 的 元 素 : 


undefined, Succ undefined, Succ (Succ undefined), ... 


老实 说 ， 这 些 非 完整 数 不 是 很 有 用 ， 但 是 它们 确实 存在 。 可 以 把 Succ undaefined 理解 
为 这 样 的 数 ， 只 知道 这 个 数 至 少 是 1: 


ghci> Zero == Succ undefined 
False 

ghci> Succ Zero == Succ undefined 
水 冰冰 Exception: Prelude.undefined 


Nat 还 有 男 外 一 个 数 : 
infinity :;: Nat 
infinity = Succ infinity 


因此 


ghci> Zero == infinity 
False 

ghci> Succ Zero == infinity 
False 


等 等 。 

总 之 ，Nat 的 元 素 构 成 包括 有 穷 数 、 非 完整 数 和 无 穷 数 (只 有 一 个 )。 对 于 其 他 数据 
类 型 有 同样 的 结论 : 该 类 型 包含 有 穷 元 素 、 非 完整 元 素 和 无 穷 元 素 。 

也 可 以 选择 Succ 为 严格 的 ， 通 过 下 列 方式 达到 目的 : 

data Nat = Zero | Succ INat 
其 中 标记 ! 称 为 严格 标志 ( strictness flag)。 对 于 这 样 的 声明 ， 有 如 下 结 采 : 


ghci> Zero == Succ undefined 
*** Exception: Prelude.undefined 


这 次 对 等 式 测试 求 值 迫使 两 边 求 值 ， 对 Succ undefined 求 值 引起 错误 信息 。 定 义 
Succ 为 严格 的 构造 函数 使 得 自然 数 只 包含 有 穷 数 和 一 个 无 定义 数 。 


3.5 习题 
习题 A ”以 下 哪些 表达 式 表示 1? 
-2+3,3+ -2, 3+ (-2), subtract 2 3, 2 + subtract 3 


标准 引导 库 中 有 一 个 函数 £1ip， 定 义 为 


下 二 要 站 人 学 于 


请 用 flip 表示 subtract。 
习题 B Haskell 至 少 有 3 种 定义 求 究 的 方法 : 


(°) :: (Num a, Integral b) => a ->b->a 
(°°) :: (Fractional a, Integral b) => a -> b -> a 
(**) :: (Floating a) => a -> a ->a 


运算 (^) 表示 任意 数 的 非 负 整数 次 方 ; 运算 (^^) 表示 任意 数 的 任意 整数 (包括 负 整 
数 ) 次 方 ; 运算 (**) 的 两 个 参数 都 是 分 数 。 运 算 (^) 的 定义 基本 上 使 用 第 2 章 Dick 的 方 
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法 ( 见 第 2 章 习题 了 ) 。 请 问 如 何 定义 (^^)? 
习题 C ”能 够 使 用 下 列 方法 定义 div 吗 ? 


div :: Integral a => a -> 3a& -> 3 
div x y = floor (x/y) 


习题 D 再 考虑 Clever Dick 给 floor 的 定义 : 


floor :: Float -> Integer 
floor = read . (takeWhile (/= '.') . show 


为 什么 这 个 定义 不 可 行 ? 
考虑 下 列 与 GHCi 的 微 交 互 : 


ghci> 12345678.0 :: Float 
1.2345678e7 


Haskell 人 允许 使 用 所 谓 的 科学 计数 法 (scientific notation ) ， 也 称 千 计数 法 ( exponent 
notation) 表示 某 些 浮 点 数 。 例 如 ， 上 面 的 数 表示 1. 2345678 x 10"。 当 浮 点 数 的 位 数 很 多 时 ， 
Haskell 用 这 种 形式 打印 数 。 请 给 出 男 一 个 理由 ， 说 明 为 什么 Clever Dick 的 定义 不 可 行 。 

习题 E 国 数 isart :: Float -> Integer 返回 一 个 ( 非 负 ) 数 的 平方 根 的 底 。 
仿照 3.3 节 的 方法 构造 ijsqrt x， 使 其 运行 时 间 正 比 于 log x 步 。 

习题 FE ”Haskell 提供 一 个 函数 sqrt :: Floatinga => a -> a, 它 给 出 一 个 ( 非 
负 ) 数 的 平方 根 的 合理 近似 值 。 不 过 ， 让 我 们 来 自己 定义 这 个 函数 。 如 果 y 是 Vx 的 近似 
值 ， 那 么 x/y 也 是 Vx 的 近似 值 。 而 且 , 或 者 y<Yx<x/y, 或 者 x/yY<Yx<y。 比 y 和 x/y 更 
好 的 Vx 的 近似 值 是 什么 (是 的 ， 你 正在 重新 发 现 求 平方 根 的 牛顿 方法 。) 

剩 下 唯一 的 问题 是 决定 近似 值 什么 时 候 就 足够 好 了 。 一 种 可 能 的 测试 是 |” -x| <e， 
其 中 |x | 表示 zx 的 绝对 值 ，e 是 一 个 适当 小 的 数 。 这 个 测试 保证 绝对 误差 不 超过 s。 男 一 
种 测试 是 |y -* | <sx， 保 证 相对 误差 不 超过 se。 假定 类 型 Float 的 数 只 精确 到 6 位 有 效 
数字 ， 请 问 两 种 测试 中 哪 一 种 更 合理 ? se 的 合理 值 是 多 少 ? 

请 由 此 给 出 sart 的 定义 。 

习题 G 请 给 出 Nat 作为 类 族 orda 实例 的 显 式 定 义 。 由 此 给 出 下 列 方法 的 一 个 定义 : 


divMod :: Nat -> Nat -> (Nat,Nat) 


3.6 答案 

习题 A 答案 除 3+ -2 和 2 + subtract 3 之 外 ， 而 且 这 两 个 式 子 都 不 是 合式 表达 
式 。 饶 义 subtract = flip (=)。 

习题 B 答案 

xDn=if0<=nthen xn else i/(x ~ (negate D)) 

习题 C 答案 不 能 。 需 要 写成 


div ;: Integral a => a -> 8 -> 3 
div x y = floor (fromIntegral x / fromIntegral y) 


习题 D 答案 ” Clever Dick 的 函数 给 出 floor ( -3.1) = -3，, 而 正确 答案 是 -4。 
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如 果 在 结果 是 负数 的 情况 下 通过 减 1 设法 修改 他 的 定义 ,那么 floor ( -3.0) = -4， 
但 是 正确 答案 是 -3。 也 不 行 ! 
另外 ，Clever Dick 的 解 给 出 floor 12345678 .0 = 1， 因 为 参数 显示 为 1. 2345678e7。 
习题 E 答案 


isqrt :: Float -> Integer 
isqrt x = fst (until unit (shrink x) (bound x)) 
Where unit (m,n) = (m+1 == n) 


shrink :: Float -> Interval -> Interval 
shrink x (m,n) = if (p*p) “leq. x then (p,n) else (m,p) 
where p = (mt+n) “div” 2 


bound :: Float -> Interval 
bound x = (0,until above (*2) 1) 
Where above n = x “1t™ (n*n) 


函数 `leq` 和 `1t ` 在 3.3 节 有 定义 。 注音 表达 式 (p*p) “leq x 和 x “lt (n*n) 
中 的 插 号 。 这 里 没有 说 明 `1leq` 和 `1t` 的 结合 次 序 ， 所 以 如 果 没 有 插 号 的 话 ， 两 个 表达 
式 会 被 解释 成 病态 的 表达 式 p * (p `leq` x) 和 (x `lt` n) *n。( 实 际 上 我 第 一 次 输入 
本 答案 时 犯 了 这 个 错误 。) 

习题 F 答案 比 y 和 xy 更 好 的 Vx 的 近似 值 是 (y +x/y)/2。 相 对 误差 更 合理 ， 而 且 
程序 如 下 : 


sgqrt :: Float -> Float 
sqrt x = until goodenough improve x 
Where goodenough y = abs (y*y-x) < eps*x 
improve y = (y+x/y)/2 
eps = 0.000001 


习题 G 答案 ”只 要 定义 ( < ) 即 可 : 


instance 0rd Nat where 


Zero < Zero = False 
Zero < Succ 1n = True 
Succ m < Zero = False 
Succ m < Succ n = (m < n) 
现在 可 以 定义 : 


divMod :: Nat -> Nat -> (Nat,Nat) 
divMod x y = if x < y then (Zero,x) 
else (Succ q,r) 
where (gq,r) = divMod (x-y) y 


3.7 注 记 


关于 计算 机 算术 的 最 基本 参考 资料 是 Don Knuth 的 《The Art of Computer Programming， 


Volume 2: Semi-numerical Algorithms》 (Addison-Wesley，1998 ) 。 取 底 和 其 他 简单 数值 函数 
的 深入 人 研究 参见 Don Knuth、Ronald Graham 和 Oren Patashnik 所 著 的 《Concrete Mathemat- 
ics》( Addison-Wesley，1989 ) 。 
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列 表 





列表 是 函数 式 程序 设计 的 引擎 。 函 数 之 则 的 数据 获取 和 传递 可 用 列表 完成 。 列 表 可 以 
拆 分 、 重 组 或 者 与 其 他 列表 结合 形成 新 的 列表 。 数 的 列表 可 以 求 和 或 者 求 积 ， 字 符 列表 可 
以 被 读 号 ， 等 等 。 总 之 ,列表 上 的 有 用 运算 可 以 列 出 很 多 。 本 章 描述 一 些 常用 的 列表 运 
算 ， 不过， 有 一 类 特别 重要 的 运算 将 在 第 6 章 讨 论 。 


4. 1 列表 记 法 


如 前 所 讲 ， 类 型 [a] 表示 元 素 为 a 的 列表 。 空 列表 用 [] 表示 。 用 户 可 以 构造 任何 类 型 
的 列表 ,但 是 在 同一 个 列表 中 不 可 以 包含 不 同类 型 的 元 素 。 例 如 : 


[undefined,undefined] :: [al 


[sin,cos,tan] :: Floating a => [a -> a] 

[[1;2,3] ,[4,8]] :: Num a => [[a]] 

[tea" "FoF".2] not valid 

列表 记 法 ， 如 [1 ,2,3] 实 际 上 是 下 面 更 基本 记 法 的 简写 : 
:22:3: [0 


运算 (:) ::a -> [al -> [a], 读 作 “cons”， 是 列表 的 构造 函数 。 因 为 该 运算 是 
右 结 合 的 ， 所 以 上 面 的 表达 式 无 需 圆 括号 。 该 运算 没有 相关 联 的 定义 ， 所 以 称 为 构造 函 
数 。 换 言 之 ， 不 存在 化 简 诸如 1 :2 : [] 的 表达 式 的 规则 。 运 算 ( : ) 对 于 两 个 参数 都 是 非 严 
格 的 ， 更 确切 地 说 ， 它 是 非 严 格 的 ， 并 返回 非 严 格 的 函数 。 表 达 式 


Undefined : undefined 


可 能 不 是 很 有 趣 ， 但 是 ， 可 以 确定 的 是 ， 它 不 是 空 列表 。 事 实 上 ， 这 也 是 我 们 对 该 列表 知 
道 的 唯一 信息 。 注 意 ， 表 达 式 中 两 个 undefined 具有 不 同 的 类 型 。 
空 列 表 [] 也 是 列表 的 一 个 构造 郴 数 。 在 Haskell 中 作为 数据 类 型 的 列表 具有 下 列 说 明 : 


data List a = Nil | Cons a (List a) 


唯一 的 区 别 是 List a 写成 了 [a] ，Nil 写成 了 [] ，Cons 写成 了 (:)。 

根据 以 上 说 明 ， 类 型 为 [a] 的 每 个 列表 具有 下 列 三 种 形式 之 一 : 

e 无 定义 的 列表 unaefined ::[al]; 

e 空 列表 [] ::[a]; 

e 形 如 入 :xs 的 列表 ,其 中 x ::a, xs ::[a]。 

由 此 得 出 列表 有 三 种 : 

。 利用 (:) 和 [] 构 造 的 有 穷 (finite) 列表 ,如 1:2:3:[]。 

。 利用 (:) 和 undefined 构造 的 非 完 整 (partial) 列表 或 者 部 分 列表 ， 如 列表 
filter (<4) [1..] 是 非 完整 列表 1:2 :3:undaefined。 我 们 知道 在 3 之 后 不 
存在 小 于 4 的 整数 ， 但 是 Haskell 只 是 一 个 计算 侨 ， 不 是 定理 证 明 器 ， 所 以 Haskell 
继续 一 直 疝 后 检查 ， 而 且 没 有 找到 满足 条 件 的 数字 。 
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e 只 用 ( : ) 构造 的 无 穷 (infinite) 列表 ， 如 [1..] 是 非 负 整数 的 无 穷 列表 。 
三 种 列表 都 会 出 现在 日 常 程序 设计 中 。 第 9 章 将 探讨 无 穷 列表 及 其 应 用 。 例 如 ， 预 定 
义 了 天数 iterate 返回 一 个 无 穷 列表 


iterate :: (a -> a) -> a -> [al] 
iterate f x = x:iterate f (f x) 


特别 是 ，iterate ( +1) 1 是 正 整 数 的 无 穷 列表 ， 该 列表 也 可 写成 [1 ..] (参见 4.2 节 )。 
太一 个 例 于 是 
head (filter perfect [1..]) 
Where perfect n = (n == sum (divisors n)) 
它 返 回 第 一 个 完全 数 ， 即 6， 只 是 目前 没 人 知道 filter perfect [1..] 是 一 个 无 穷 列 
表 还 是 非 完整 列表 。 
最 后 ， 可 以 定义 : 


until p f = head . filter p . iterate 工 


在 第 3 章 中 函数 until 用 于 计算 取 底 函数 。 这 个 例子 也 说 明 ， 在 程序 设计 中 看 似 简 单 的 
函数 通常 可 以 用 更 简单 函数 的 复合 表示 。 这 有 些 像 质 子 和 硅 克 。 


4.2 枚 举 


Haskell 提供 枚 举 整数 列表 的 有 用 记 法 。 如 果 m 和 nn 是 整数 ， 并 且 m <n， 则 可 以 用 下 
列 记 法 : 

[m. .n] 表 示 列 表 [m, m+1, …, n] 

[m. . ] 表示 无 穷 列表 [m, m+1, m+2, …*] 

[m,n. .Bp] 表 示 列 表 [m, m+(n-m), m+2(n-m), …, mt+a(n-m)」], 其 中 a 
是 满足 m+a(n 一 m) <p 的 最 大 整数 。 

[m,n..] 表 示 无 穷 列表 [m, m+ (n-m), m+2 (n-m), *…] 

前 两 种 记 法 在 实际 应 用 中 经 常 出 现 ， 后 两 种 出 现 不 太 多 。 例 如 : 

Ehei> [0,24,141] 

[0,2,4,6,8,10] 

ghci> [1,3..] 

[1,3,5,7,9,11 {Interrupted} 

第 一 个 例子 列表 止 于 10， 这 是 因为 11 不 是 偶数 。 在 第 二 个 例子 中 ， 很 快 中 断 了 无 穷 
列表 的 计算 。 

事实 上 ， 枚 举 不 限于 整数 ， 而 是 类 族 Enum 的 任何 类 型 都 可 以 使 用 枚 举 。 这 里 不 再 歼 
述 类 族 Enum， 只 说 明 类 型 char 是 Enum 的 成 员 : 


ehei> ar] 
"abcdefghijklmnopgrstuvwxyz" 
4.3 列表 概括 


Haskell 提供 了 另外 一 种 非常 有 用 而 且 特 具 魅力 的 列表 记 法 ， 称 为 列表 概括 (list com- 
prehension) ， 可 用 其 他 列表 构造 列表 。 下 面 列举 几 个 例子 ; 
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ghci> [x*x | x <- [1..5]] 

[1,4,9,16,25] 

ghci> [x*x | x <- [1..5], isPrime x] 

[4,9,25] 

Eheiy 上 5 | ee sd Sven 1, 4 < EE .5 

[(2,2), (2,3),(2,4), (2,5), (4,4), (4,5)] 

sici> [x | xs <= 【3 LE5 OK 2 (9,%) <= 8 

[4 ,2] 

再 举 一 例 。 假 设 要 生成 某 个 范围 的 所 有 毕 达 哥 拉 斯 三 元 数 ， 即 对 于 某 个 给 定 的 n， 使 
得 x +yY =z 而 且 1<x,y, zn 的 三 元 组 (x*，y，z) 。 可 以 定义 : 


triads :: Int -> [(Int,Int,Int)] 
triads n = [(x,y,2) | x <- [i,n], y <- [1..n], 
z <- [i..n], XxX*x+y*y==ZZ*ZZ] 


因此 


ghci> triads 15 
FE,4 ,5) (4,3,.5), (5,.12,13), 6,80,10), 
(8,6,10), (9,12,15), (12,5,13), (12,9,15)] 

或 许 这 并 非 我 们 想 要 的 结果 : 每 个 本 质 上 不 一 样 的 三 元 组 用 两 种 不 同 的 方法 生成 。 而 且 ， 
列表 中 包括 基本 三 元 组 的 见 余 。 

为 了 改进 triad 的 定义 ， 可 以 限制 x 和 yy 使 得 x*<y， 而且 x 和 Yy 互 素 ， 即 它们 没有 
公共 因子 。 数 学 家 知道 2x 不 可 能 是 一 个 数 的 平方 ， 所 以 第 一 个 限制 是 正确 的 。 一 个 数 的 
因子 可 以 如 下 计算 : 


divisors x = [da | d <- [2..x-1], x ‘mod* d == 0] 


因此 有 


coprime x y = disjoint (divisors x) (divisors y) 


这 里 disjoint 的 定义 留 作 练习 。 
根据 以 上 讨论 ， 现 在 可 以 定义 : 
triads n= [(x,¥2) | x < [i..n], y < [Cr .nj, 
coprime x y, 
z <- [y+1..n], XxX*x+y*y==Z*ZZ] 
这 个 定义 好 于 前 一 个 定义 ， 不 过 还 可 以 尝试 让 函数 运行 更 快 一 点 ， 主要 目的 是 说 明 一 个 思 
想 。 由 2x <x +y =z*<m 可 以 推出 x<n/N2， 所 以 x<Ln/W24。 因 此 ， 可 以 定义 : 


triads n = L(xsy,2) | x <= [i..m], y <= 区 et al， 
coprime x y, 
z <- [y+1..n], XxX*X+y*y== 志 * 乙 ] 
Where m = floor (n / sqrt 2) 


但 是 ，m 的 表达 式 是 不 正确 的 : n 的 类 型 是 Int ， 整 数 不 能 做 除法 。 这 里 需要 一 个 显 式 的 
转换 图 数 ， 应 该 使 用 图 数 fromIntegral (注意 不 是 fromInteger， 因 为 n 是 Int， 
而 不 是 Integer )。 需 要 将 m 定义 为 m = floor (fromIntegral n / sgqrt 2 )。 再 次 
强调 ， 必 须 注意 所 处 理 的 数 的 类 型 ， 并 且 了 解 不 同类 型 数 之 间 的 转换 函数 。 

列表 概括 可 用 于 定义 列表 上 的 某 些 和 常用 函数 。 例 如 : 
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map f xs ni [下 二 <= 
filter p xs = [x [| x <- xs, Pp XX 
concat xss = [x | xs <- xss, x <- xs] 


实际 上 ， 在 Haskell 中 情况 正好 相反 : 列表 概括 被 翻译 成 使 用 map 和 concat 的 等 价 
定义 。 翻 译 规则 如 下 : 


[e |True] = [e] 
[e | qj = [e | q, True] 
[e | b, Q] = if b then [e | Q] else [] 
[e | p <- xs, Q] = let ok p= [e | Q] 
ok _= [] 


in concat (map ok xs) 


第 四 条 规则 中 ok 的 定义 使 用 了 不 关心 ( don't care) 模式 (或 者 不 介意 模式 )， 也 称 为 通 
配 符 。 第 四 条 规则 中 的 p 是 一 个 模式 ， 并 且 ok 的 定义 说 明 ， 对 于 任何 不 满足 模式 p 的 参 
数 ， 其 返回 值 是 空 列表 。 
另 一 个 有 用 的 规则 是 
[e | Q1, Q2] = concat [[e | 92] | Q1] 


4.4 一 些 基本 运算 
列表 函数 可 以 通过 模式 匹配 定义 。 例 如 ; 


null :: [a] -> Bool 
null [0 = True 
null (x:xs) = False 


模式 [] 和 x:xs 不 同 ， 而 且 它 们 涵盖 了 所 有 可 能 情况 ， 所 以 ， 以 上 null 定义 的 两 个 
等 式 以 任何 顺序 书写 者 可以。 函数 null 是 严格 的 ， 因 为 Haskell 必须 通过 对 参数 求 值 ， 
至 少 算 到 可 以 判断 参数 是 否 为 空 列表 ， 才 能 决定 使 用 定义 的 哪个 等 式 。( 一 个 问题 是 为 什 
么 不 使 用 简单 的 定义 null = (==[])?) 以 上 定义 也 可 以 写成 


null [] = True 
null _ = False 


这 个 定义 使 用 了 不 关心 模式 。 
下 面 是 使 用 模式 匹配 的 另外 两 个 定义 : 
head :: [a] -> a 


head (x:xs) = xX 


tail :: [a] -> [a] 
tail (x:xs) = xs 


以 上 定义 中 不 包含 模式 为 [] 的 等 式 ， 所 以 ， 如 果 对 head [] 或 者 tail [] 求 值 ， 则 
Haskell 报错 。 
在 模式 中 也 可 以 用 [x] 表 示 x:[]: 


last :: [a] -> a 
last [x] = Xx 
last (x:y:ys) = last (y:ys) 


第 一 个 等 式 中 的 模式 匹配 单元 素 列表 ， 第 二 个 等 式 中 的 模式 匹配 至 少 有 两 个 元 素 的 列表 。 
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标准 引导 函数 库 的 last 定义 稍 有 区 别 : 


last [x] = xX 
last (_:xs) = last xs 


定义 中 使 用 了 不 关心 模式 。 两 个 等 式 必 须 按照 这 种 顺序 书写 ， 因 为 x: [] 与 两 个 模式 均 
匹配 。 


4.5 串联 


下 面 是 串联 运算 ( ++ ) 的 定义 : 
CE 55 hal =» Lal => [a 
[] ++ ys = ys 
(X:XS) ++ ys = XxX:(xs ++ ys) 
定义 在 第 一 个 参数 上 ， 而 不 是 第 二 个 参数 上 使 用 了 模式 匹配 。 第 二 个 等 式 很 简洁 ， 需 
要 一 点 思考 来 理解 ， 但 是 ,一旦 理解 后 ， 读 者 会 对 函数 程序 中 列表 如 何 运 作 种 然 大 悟 。 下 
面 是 一 个 简单 的 求 值 过 程 : 
[1,2] ++ [3,4,5] 
= {表示 法 } 
Ci (C2: [5])) ++ C3: (4 (5: []))) 
= {++ 的 第 二 个 等 式 } 
i1:((2:0) ++ (3: (4:(5:[])))) 
= { 同 前 } 
1:(2:([] ++ (3:(4:{5:[]))))) 
= {++ 的 第 一 个 等 式 } 
1: (2:(3:(4: (5:[])))) 
= {表示 法 } 
[1,2,3,4,5] 


如 该 例 所 示 ， 对 xs ++ys 求 什 的 代价 与 xs 的 长 度 成 正比 ， 其 中 长 度 定义 为 


length :: [a] -> Int 
length [] = 0 
length (x:xs) = 1 + length xs 


同时 注意 下 面 的 列表 : 


undefined ++ [1,2] = undefined 
[i1,2] ++ undefined = 1:2:undefined 


对 第 一 个 列表 一 无 所 知 ， 但 是 ， 知 道 第 二 个 列表 的 开始 元 素 是 1 ， 下 一 个 元 素 是 2。 
串联 是 满足 结合 律 的 运算 ， 所 以 对 于 任意 列表 xs、ys 和 zs 下 列 等 式 成 立 : 


(xs ++ ys) ++ ZS8 = XS ++ (ys ++ ZS) 
第 6 章 将 讨论 如 何 证 明 这 样 的 断言 。 
4.6 函数 cancat、map 和 filter 


读者 已 经 看 到 列表 上 的 3 个 最 有 用 的 运算 : concat 、map 和 filter。 下面 是 这 些 
函数 利用 模式 匹配 的 定义 : 
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concat :: [[a]] -> [aj] 
concat 癌 = [] 
concat (xs:xss) = XS ++ concat xss 


map :: (a -> b) -> [a] -> [b] 
map f [] = [] 
map f (x:xs) = f x:map f xs 


filter :: (a -> Bool) -> [a] -> [al 

filter p {] = [] 

filter p (x:xs) = if p x then x:filter p xs 
else filter p xs 


这 些 定义 中 包含 一 个 共同 的 主题 ， 将 会 在 第 6 草 进 一 步 探 讨 。 函 数 filter 的 为 一 种 
定义 是 

filter p = concat . map (test p) 

test p x = if p x then [x] else [] 


在 这 个 定义 中 ，filter p 首先 将 列表 中 满足 条 件 p 的 每 个 元 素 转换 为 单元 素 列 表 ， 
不 满足 条 件 p 的 转换 为 空 列表 ， 然 后 将 这 些 列表 串联 。 

图 数 map 的 两 个 基本 性 质 是 

map id = id 

map (f . g) = mapf .mapeEg 
第 一 个 等 式 表示 将 恒 等 图 数 应 用 于 列表 的 每 个 元 素 ， 结 果 与 原 列 表 相 同 。 这 个 定律 中 等 式 
两 边 的 id 有 不 同 的 类 型 : 左边 的 id 类 型 是 a -> a， 而 右边 的 id 类 型 是 [a] -> [al]。 
第 二 个 等 式 表 示 将 g 应 用 于 一 个 列表 的 每 个 元 素 ， 然 后 将 £ 应 用 于 前 面 结果 的 每 个 元 素 ， 
最 后 结果 等 同 于 将 三 . g 应 用 于 原 列表 的 每 个 元 素 。 如 果 将 第 二 个 等 式 从 右 回 左 读 ， 该 等 
式 表 示 对 一 个 列表 的 两 次 遍历 可 以 用 一 次 遍历 代替 ， 其 好 处 是 效率 更 高 。 

以 上 两 个 等 式 称 为 map 的 函 子 〈functor) 定律 。 这 个 术语 来 和 目 一 个 数学 分 文 一 一 范 晴 
论 。 实 际 上 ，Haskell 提供 了 一 个 类 族 Functor， 其 定义 如 下 : 

class Functor f where 

fmap :: (a -> b) -> fa -> fb 

方法 fmap 应 该 与 map 一 样 满足 同样 的 定律 。 定 义 这 个 类 族 的 原因 是 ， 将 函数 应 用 于 列表 
的 思想 可 以 推广 到 将 函数 应 用 于 任意 数据 结构 ， 如 各 种 树 形 结 构 。 例 如 ， 考 虑 下 列 叶 结 点 
带 标 记 的 二 又 树 类 型 


data Tree a = Tip a | Fork (Tree a) (Tree a) 


具有 树 状 结构 的 数据 会 在 许多 场合 出 现 ， 如 各 种 表达 式 的 语法 具有 树 状 结构 。 在 树 上 
也 可 以 定义 函数 的 映射 ， 不 叫 mapTree， 而 是 只 要 将 树 定义 为 类 族 Functor 的 成 员 ， 就 


可 以 称 之 为 fmap: 
instance Functor Tree where 
fmap f (Tip x) = Tip (f x) 


fmap f (Fork u v) = Fork (fmap f u) (fmap f v) 


事实 上 ， 列 表 作 为 类 族 Functor 实例 ，map 只 是 fmap 的 同义词 : 


ghci> fmap (+1) [2,3,4] 
[3,4,5] 
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前 面 曾 讲 过 ， 定 义 类 族 Functor 的 主要 目的 是 实现 可 以 映射 到 列表 上 的 函数 也 可 以 
映射 到 其 他 数据 结构 上 ，Haskell 已 经 实现 了 这 一 点 ， 并 且 引 和 人 了 一 个 合适 的 类 族 。 在 今 
后 的 章节 ， 特 别 是 第 12 章 ， 读 者 将 看 到 map 的 末 子 定律 出 现在 许多 计算 中 。 

吨 数 map 还 满足 另外 一 组 定律 ， 并 且 具 有 相同 的 主题 。 考 虑 下 面 的 等 式 : 


f .head = head . map ff 
map £f . tail = tail . map f 
map f . concat = concat . map (map £) 


第 一 个 等 式 仅 当 ff 是 严格 函数 时 成 立 , 但 是 为 外 两 个 等 式 对 于 任何 函数 £ 都 成 立 。 如 果 将 
第 一 个 等 式 两 边 均 应 用 于 空 列表 ， 则 有 


f (head []) = head (map f []) = head [] 


因为 空 列表 的 首 元 素 是 无 定义 的 ， 故 只 有 f£ 是 严格 函数 时 该 等 式 才 成 立 。 

以 上 每 个 定律 都 有 简单 的 解释 。 对 于 每 种 情况 ， 可 以 先 把 运算 (head、tail 等 ) 
应 用 于 一 个 列表 ， 然 后 改变 每 个 元 素 ， 或 者 先 改变 每 个 元 素 ， 然 后 应 用 这 些 运算 。 这 些 共 
同 点 源 于 这 些 运算 的 类 型 是 


head :: [a] -> a 
tail :: [a] -> [a] 
concat :: [[a]] -> [a 


这 些 运算 的 关键 点 是 不 依赖 于 列表 的 特性 ， 它 们 只 是 在 列表 上 移动 、 舍 弃 或 者 提取 元 
素 的 简单 函数 。 所 以 它们 的 类 型 是 多 态 的 。 而 且 ， 具 有 多 态 类 型 的 函数 均 满 足 定律 : 可 以 
先 修改 值 再 应 用 这 个 函数 ， 也 可 以 先 应 用 函数 再 修改 值 。 在 数学 上 这 种 函数 称 为 自然 变换 
(natural transformation ) ， 相 关 的 定律 称 为 自然 律 (natural law)。 

再 看 一 个 例子 。 因 为 reverse :: [a] -> [a]， 所 以 期 望 下 列 等 式 成 立 : 


map f . reverse = Teverse . map f 


情况 确实 如 此 。 当 然 ， 该 自然 律 还 有 待 证明 。 
男 一 个 定律 是 


concat . map concat = concat . concat 


这 个 定律 表示 ， 等 式 两 边 串联 由 列表 的 列表 构成 的 列表 的 两 种 方式 的 结果 是 一 样 的 〈 或 者 
先进 行内 部 串联 ， 或 者 先 做 外 部 的 串联 )。 
最 后 是 filter 的 一 个 性 质 : 


filter p . map f = map f . filter (p . f£) 


可 以 用 等 式 推导 的 方式 证 明 这 个 定律 : 

filter P . map f 

= {filter 的 第 二 个 定义 } 
concat . map (test p) . map f 

= {map 的 函 子 性 质 } 
concat . map (test p . £) 

= {因为 test p . f= map f . test (p . f)} 
concat . map (map f . test (p . f£)) 

= {map 的 函 子 性 质 } 
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concat . map (map f) . map (test (p . £)) 
= {concat 的 自然 律 } 

map f . concat . map (test (p . f£)) 
= {filter 的 第 二 个 定义 } 

nap 大 »。 filter (p .. £) 


上 面 这 些 定律 不 仅 在 学 术 上 有 价值 ， 而 且 可 用 于 发 现 新 的 、 更 好 的 表达 定义 的 方法 。 


这 就 是 为 什么 函数 式 程序 设计 是 有 史 以 来 最 好 的 程序 设计 方法 。 
4.7 函数 zip 和 zipWith 


最 后 ， 为 了 给 出 一 个 完整 简单 的 常用 运算 的 工具 箱 ， 再 来 考虑 图 数 zip 和 zipwith。 


它们 在 标准 引导 库 中 的 定义 如 下 : 


了 


zip is [a] => [本 => Lm,b}] 

Zip (x:xs) (y:ys) = (x,y): Zip xs ys 

Zip _ = [] 

zipWith :: (a -> b -> ©) -> fa] -> [b] -> [c] 
ZipWith f (x:xs) (y:ys) = f xy : ZipWith f xs ys 


zipWith f _ _ = [)] 

细心 的 程序 员 〈 不 喜欢 “不 关心 ”模式 的 程序 员 ) 可 能 给 出 如 下 定义 : 
zip [] ys = [] 

zip (x:xs) [] = [] 


Zip (x:xs) (y:ys) = (X,yY) :Zip xs ys 


两 个 定义 均 使 用 在 两 个 参数 上 的 模式 匹配 。 必 须 明 白 的 是 ， 模 式 匹配 的 次 序 是 从 上 到 
目 左 到 右 。 因 此 ， 根 据 定义 有 


zip [] undefined = [] 
zip undefined [] = undefined 


商 数 zip 的 定义 可 以 用 万 一 种 方式 表达 : 


zip = ZipWith (,) 


这 里 的 运算 (，, ) 是 二 元 组 的 一 个 构造 孙 数 : (,)ab = (a,b)。 


下 面 是 使 用 zipwith 的 一 个 例子 。 假 定 要 检查 一 个 列表 元 素 是 否 呈 非 递 减 序 。 一 种 


直接 定义 方法 可 能 是 


nondec :: (0rd a) => [al] -> Bool 

nondec [] = True 

nondec [x] = True 

nondec (x:y:xs) = (x <= y) && nondec (y:xs) 


但 是 ， 男 一 种 等 价 而 且 更 简短 的 定义 是 


nondec xs = and (zipWith (<=) xs (tail xs)) 


限 数 and 是 为 一 个 常用 的 标准 引导 库 函 数 。 如 有 果 一 个 布尔 值 列表 的 所 有 元 素 均 为 


True， 则 该 函数 返回 True， 否 则 返回 False: 


and :: [Bool] -> Bool 
and [|] = True 
and (X:XS) = XxX && and xs 
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再 来 看 最 后 一 个 例子 。 考 虑 定义 一 个 图 数 position， 对 于 一 个 值 x 和 一 个 有 穷 列表 
xs， 该 图 数 返回 x 在 列表 中 出 现 的 第 一 个 位 置 (位 置 从 0 开始 计算 )。 如 果 x 在 xs 中 不 
出 现 ， 则 返回 - 1。 该 函数 可 以 如 下 定义 : 


position :: (Eq a) => a -> [a] -> Int 
position x xs 
= head ([j | (j,y) <- zip [0..] xs, y==x] ++ [-1]) 


表达 式 zip [0..] xs 将 xs 的 每 个 元 素 与 其 在 xs 中 的 位 置 配 对 。 尽 管 第 一 个 参数 
是 无 穷 列 表 ， 但 是 ， 如 果 xs 是 有 穷 的， 那么 结果 也 是 有 穷 列表 。 注 意 以 上 的 解决 方法 是 ， 
首先 计算 x 出 现 的 所 有 位 置 列 表 ， 然 后 取 第 一 个 元 素 。 根 据 惰 性 计算 策略 ， 计 算 一 个 列表 
的 第 一 个 元 素 不 必 构 造 列 表 的 所 有 元 素 ， 所 以 ， 这 种 解法 在 效率 上 并 无 损失 。 可 以 看 出 ， 
这 种 用 所 有 的 查找 结果 来 表达 一 个 查找 结果 是 多 么 简单 1 


4.8 高 频 词 的 完整 解 
现在 给 出 1. 3 节 国 数 commonWords 的 完整 定义 。 已 经 定义 了 : 


commonWords :: Int -> [Char] -> [Char] 

commonWords n = concat . map showRun . take n ， 
sortRuns . countRuns . SortWords . 
words . map toLower 


需要 进一步 给 出 定义 的 是 下 列 函 数 : 


showRun countRuns sortRuns sortWords 


其 他 函数 ,包括 words ， 是 标准 Haskell 库 函 数 。 
第 一 个 函数 定义 简单 : 

showRun :: (Int,Word) -> [Char] 

showRun (nw) = Ww ++ 1: "++ Show n ++ "\n" 

第 二 个 函数 可 以 如 下 定义 : 


countRuns :: [Word] -> [(Int,Word)] 

countRuns [] = [] 

countRuns (wi:ws) = (i+length us,w):countRuns vs 
Where (us,vs) = span (==W) Ws 


其 中 引导 库 图 数 span p 将 列表 拆 分 为 两 个 列表 ， 第 一 个 是 列表 中 的 最 大 前 缀 ， 其 所 有 元 
素 都 满足 性 质 p， 第 二 个 列表 是 剩余 的 后 级 。 下 面 是 定义 : 


span :: (a -> Bool) -> [a] -> ([a] , [a]) 
span p [J = ([]., []) 
span p (x:xs) = if p x then (x:ys,2zs) 
else ([] ,x:xs) 
Where (ys,2s) = Span p XS 


现在 余下 sortRuns 和 sortWwords 尚未 定义 。 可 以 使 用 下 列 命令 从 模块 Data. 


List 输入 图 数 sort: 


import Data.List (sort) 


因为 sort 的 类 型 为 sort :: (0rd a) =>[a] -> [a] ， 所 以 定义 : 
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sortWords :: [Word] -> [Word] 
sortWords = sort 


sortRuns :: [(Int,Word)] -> [(Int,Word)] 
sortRuns = reverse . sort 


理解 第 二 个 定义 需要 明白 Haskell 在 二 元 组 上 自动 定义 了 比较 运算 ( <= ): 


(xl,yl) <= (x2,y2) = (xl < x2) || (xl == x2 && yl <= y2) 


此 外 ， 还 需要 明日 sort 将 元 素 按 照 递 增 序 排列 。 因 为 需要 按照 词 频数 递减 序 排列 ， 
所 以 先 按照 词 频数 递增 序 排列 ， 然 后 对 列表 取道 序 。 顺 便 说 明 ， 这 也 是 为 什么 把 词 频数 放 
在 词 前 ， 而 不 是 放 在 词 后 的 原因 。 

用 户 也 可 以 定义 自己 的 排序 函数 ， 代 替 使 用 库 排 序 函 数 。 一 种 好 方法 是 使 用 分 治 
(divide and conquer) 策略 : 如 果 列 表 最 多 有 一 个 元 素 ， 那 么 它 已 经 有 序 ; 否则 将 列表 分 
为 等 长 的 两 个 列表 ， 分 别 递 归 地 对 每 个 小 列表 排序 ， 然 后 把 两 个 有 序列 表 合 并 。 由 此 给 出 
下 列 定 义 : 


sort :: (Ord a) => [a] -> [a] 

sort [] = 癌 

sort [x] = [x] 

sort xs = merge (sort ys) (sort zs) 
where (ys,zs) = halve xs 


halve xs = (take n xs, drop n xs) 
Where n = length xs ‘div 2 


剩 下 的 任务 是 定义 merge， 将 两 个 有 序列 表 归 并 为 一 个 有 序列 表 : 
merge :: (0rd a) => [a] -> [a] -> [a] 
merge [] ys = ys 
merge xs [] = xs 
merge (x:xs) (y:ys) 
| x <= = x:merge xs (y:ys) 
| =u = sen ed 
实际 上 ， 许 多 Haskell 程序 员 不 会 完全 这 样 书写 merge 定义 的 最 后 一 个 子 句 。 他 们 会 
如 下 书写 : 


merge xs'Q@(x:xs) ys'@(y:ys) 
| x <= 了 = XxX:merge Xs Ys! 
| otherwise = y:merge xs' ys 


这 个 定义 使 用 了 等 同 模 式 〈as-pattern) 。 可 以 看 出 其 意义 : 代 之 以 将 列表 分 解 ， 然 后 再 重 
构 (廉价 但 并 非 无 代价 的 运算 ) 的 更 好 方法 是 ， 重 用 匹配 的 值 。 的 确 如 此 ， 不 过 这 也 使 得 
简单 的 数学 等 式 变 得 有 些 模糊 ， 在 本 书 将 非常 保守 地 使 用 这 种 模式 。 

函数 sort 和 merge 都 是 递归 定义 的 ， 值 得 说 明 的 是 ， 这 两 个 递归 均 会 终止 。 对 于 
merge 来 说 ， 每 次 递归 调用 的 两 个 参数 中 必 有 一 个 参数 在 变 小 。 因 此 ， 有 穷 步 后 必 能 划 
归 到 其 中 的 一 个 递归 基 。 对 于 sort 来 说 ， 必 须 注意 到 如 果 xs 的 长 度 至 少 为 2， 那么 ys 和 
zs 的 长 度 均 严格 地 小 于 xs 的 长 度 ， 所 以 同样 会 终止 。 但是， 如 果 省 略 子 句 sort [x] = 
[x] 会 出 现 什么 情况 。 因 为 1 div 2 =0， 故 有 


sort [x] = merge (sort []) (sort [x]) 
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这 表示 sort [x] 的 求 值 需要 对 sort [x] 求 值 ， 所 以 ,对 于 非 空 列表 情况 ，sort 的 整个 
定义 陷 人 一 个 无 穷 循 环 之 中 。 定 义 递 归 函 数 时 ， 其 中 最 重要 的 一 部 分 是 检查 定义 已 包含 了 
所 有 必需 的 基本 情况 。 


4.9 习题 
习题 A ”下列 等 式 哪些 对 所 有 的 xs 成 立 ， 哪 些 不 成 立 ? 


口 :xs = xs 

[j:xs = [[] ,xs] 

xs:[] = xs 

xs:[] = [xs] 

xs:xs = [xs,xs] 

[[]] ++ xs = xs 

[[]] ++ xs = [[] ,xs] 
[LY + [za] =: LU] ,xs] 


[xs] ++ [] = [xs] 

男 外 ， 为 什么 没有 定义 null = (==[])? 

习题 B 假设 要 列 出 目 然 数 的 所 有 不 同 数 对 (*，y) 。 列 出 数 对 的 顺序 不 重要 ， 只 要 
能 够 列 出 所 有 数 对 即 可 。 请 问 下 面 的 定义 是 否 可 行 ? 


allPpairzs = [I(xsy) | x 人 加 Ye wl] 


如 果 认 为 该 定义 不 能 完成 这 项 任务 ， 请 给 出 一 种 定义 。 
习题 C ”定义 下 列 函 数 : 


disjoint :: (Drd a) => [a] -> [a] -> Bool 


该 函数 检查 两 个 递减 序列 表 是 否 有 公共 元 素 。 
习题 D ”在 什么 条 件 下 ， 以 下 定义 给 出 相同 的 结果 ? 


[le | x <- xs, p x, y <= ys] 
[le | x <- xs, y <- ys, p xX] 


比较 对 两 个 表达 式 求 值 的 代价 。 

习题 E ” 当 伟 大 的 印度 数学 家 Srinivasan Ramanujan 因 病 在 伦敦 住院 时 ， 英 国 数学 家 
G. H. Hardy 去 探望 他 。Hardy 试图 找 个 话题 ， 就 说 他 是 乘 出 租车 来 的 ， 车 号 是 1729， 一 个 
对 他 来 说 很 平凡 的 数字 。Ramanujan 立即 回答 说 ， 不 然 ， 这 是 第 一 个 能 够 用 两 种 本 质 不 同 
的 方式 表示 成 两 个 数 的 立方 和 的 数 : 1 +12 =9 +10 =1729。 请 写 一 个 程序 ， 并 计算 出 
第 二 个 这 样 的 数 。 

事实 上 ， 定 义 一 个 返回 范围 在 0<a, 6, c, dsn, 满足 a +b =c +d 的 所 有 本 质 上 
不 同 的 四 元 组 (a, 5, c,d) 的 函数 ， 建 议 使 用 列表 概括 ， 但 是 必须 仔细 想 清楚 两 个 四 元 
组 本 质 不 同 的 含义 。 总 之 , a + =c +d 有 8 种 不 同 的 写法 。 

习题 FF 构造 列表 的 对 偶 方法 是 在 列表 的 尾部 添加 元 素 : 


data List a = Nil | Snoc (List a) a 


当然 ，Snoc 是 Cons 的 反 写 。 利 用 这 种 方式 ， 列 表 [1，2，3] 可 表示 成 


Snoc (Snoc (Snoc Nil 1) 2) 3 
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两 种 不 同 的 观点 提供 了 完全 相同 的 信息 ， 但 是 组 织 方式 不 同 。 请 给 出 Snoc 观点 的 明 
数 head 和 1last 的 定义 ， 并 定义 下 列 两 个 在 两 种 观点 之 间 转 换 的 函数 : 


toList :: [a] -> List a 
fromList :: List a -> [al 


(提示 : reverse 是 有 效 的 ， 翻 转 一 个 列表 是 线性 时 间 。) 
习题 G 对 length xs 求 值 需要 多 长 时 间 ? 考虑 length 的 男 一 种 定义 : 


length :1: La] -> Int 
length xs = loop (0,xs) 
Where loop (n,[]) = 
loop (n,x:xs) = loop (n+1,xs) 


需要 的 空间 有 变化 吗 ? 如 果 转 用 勤奋 求 值 空间 有 变化 吗 ? 这些 问 题 将 在 第 7 章 详细 讨论 。 
习题 H 引导 库 函 数 take n 取得 一 个 列表 的 前 n 个 元 素 ， 函 数 drop n 舍弃 前 并 个 
元 素 。 请 给 出 这 些 函 数 的 递归 定义 。 根 据 给 出 的 定义 ， 下 列表 达 式 的 值 是 什么 ? 


take 0 undefined take undefined [] 


一 个 更 难 的 问题 是 ， 能 否 给 出 一 个 定义 ,使 得 以 上 表达 式 的 值 均 为 []? 如 采 不 能 ， 为 
什么 ? 

下 列 等 式 中 哪些 对 于 所 有 整数 m 和 nn 都 成 立 ? 不 必 说 明理 由 ， 只 要 设法 理解 表达 式 的 
含义 即 可 。 

take n XS ++ drop n xs = XS 

take m . drop n = drop n .take (m+n) 

take m . take n = take (m “min n) 

drop m . drop n = drop (m+n) 


标准 引导 库 函 数 splitAt n 可 以 如 下 定义 : 


splitAt n xs = (take n xs,drop n xs) 


不 过 ， 显 然 以 上 定义 效率 比较 低 ， 因 为 这 里 需要 遍历 列表 xs 两 次 。 请 给 出 只 需要 所 
历 xs 一 次 的 splitAt 的 定义 。 
习题 | 对 于 等 式 : 


map (f . g) xs = map f (map g XS) 


下 列 命 题 中 ， 同 意 哪 些 ， 不 同意 哪些 (同意 无 逢 给 出 理由 )? 

1. 等 式 并 非 对 所 有 xs 成 立 ， 命题 的 真 假 依赖 于 xs 是 否 是 有 穷 列表 。 

2. 等 式 并 非 对 所 有 £ 和 g 成 立 ， 命题 的 真 假 依赖 于 £ 和 g 是 否 是 严格 函数 。 

3. 等 式 对 于 所 有 列表 ， 包 括 有 穷 、 非 完整 和 无 穷 列表 ， 以 及 对 于 所 有 合适 类 型 的 函 
数 f£ 和 g 都 成 立 。 事实 上 , map (f . g9) = map f . mapg 是 更 简洁 的 表达 方式 。 

4. 等 式 看 似 正 确 ， 但 是 需要 根据 map 和 函数 复合 的 定义 证 明 。 

5. 从 左 至 右 来 看 等 式 ， 它 表达 了 一 种 程序 优化 : 对 一 个 列表 的 两 次 过 历 可 以 用 一 次 
遍历 完成 。 

6. 在 惰性 求 值 策略 下 并 不 是 优化 ， 因 为 map 上 求 值 没有 开始 前 ，map g xs 不 会 被 完 
全 计算 。 

7. 等 式 右边 无 论 是 分 部 计算 还 是 整体 计算 ， 中 间 都 会 产生 一 个 中 间 列 表 ， 但 是 等 式 
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左边 则 不 会 。 所 有 ， 即 使 在 惰性 求 值 策略 下， 该 等 式 也 表示 一 种 程序 优化 。 
习题 」 下 面 列 出 的 等 式 中 至 少 有 一 个 是 错误 的 。 请 识别 哪些 成 立 ， 哪 些 不 成 立 。 同 
样 ， 无 需 说 明理 由 ， 目 的 是 理解 等 式 的 含义 。 


map f . take n = take n . map f 

map f . reverse = reverse . map f 

map f . sort = sort . map f 

map f . filter p = map fst . filter snd . map (fork (f,p)) 
filter (p . g&) = map (invertg) . filter p . map & 
reverse . concat = concat . reverse . map reverse 

filter p . concat = concat . map (filter p) 


在 第 五 个 等 式 中 假定 invertg 满足 invertg . g = id。 第 四 个 等 式 中 的 函数 
fork 定义 如 下 : 


fork :: (a -> b,a -> c) -> a -> (b,c) 
fork (f,g) x = (f x, g& x) 


习题 K ”定义 图 数 unzip 和 cross 如 下 : 


unzip = fork (map fst, map snd) 
cross (f,g) = fork (f . fst，g . snd) 


这 些 函 数 的 类 型 是 什么 ? 
利用 简单 的 等 式 推理 证 明 下 列 等 式 : 


cross (map f, map g) . unzip = unzip . map (cross (f,g)) 


证 明 可 以 使 用 map 的 函 子 律 和 下 列 规则 


cross (f,g) . fork (h,k) = fork (f . h,g . k) 


fork (gE) sh =: ork (f + hg 。 
fat: . Cross (£,8) =f . fst 
snd . cross (f,g) = g . snd 


习题 L 接着 上 一 个 习题 ， 证 明 

cross (f,g) . cross (h,k) = cross (f . h,g . k) 

还 有 cross (id, id) = id (为 什么 ?)。 所 以 ，cross 除了 参数 是 一 个 二 元 组 外 ， 
看 似 具 有 图 子 的 性 质 。 是 的 ，czross 是 一 个 双 函 子 (bifunctor) 。 这 也 提示 可 以 给 出 下 列 
推广 : 


class Bifunctor p Where 
binmep :5 (a -2 D) -> (c=> dd) -> pac ->Bbd 


其 中 bimap 的 参数 是 并 列 的 ， 而 不 是 一 个 二 元 组 。 请 用 类 型 Pair 的 Bifunctor 实例 
bimap 表示 cross， 其 中 : 
type Pair ab = (a,b) 


现在 考虑 数据 类 型 : 


data Either ab = Left a | Right b 


请 将 Either 作为 Bifunctor 的 实例 ， 给 出 实例 定义 。 


4. 10 答案 
习题 A 答案 


xs:[] = [xs] 
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只 有 下 列 3 个 等 式 成 立 : 


[[]] ++ [xs] = [[],xs] 


[xs] ++ [] = [xs] 


如 果 定 义 null = ( == [])， 那么 它 的 类 型 会 有 限制 . 

null :: (Eq a) => [a] -> Bool 

这 意味 着 ， 只 有 列表 中 元 素 类 型 可 比较 相等 时 ， 列 表 才 可 以 比较 相等 。 当 然 ， 空 列表 
不 含 任何 元 素 ， 所 以 不 需要 ( = ) O 

习题 B 答案 ”答案 是 否定 的 ，allPairs 生成 下 列 无 穷 列表 : 


allPairs = [(0,y) | y <- [0..]] 


一 种 方法 是 使 用 下 列 定 义 ， 按 照 二 元 组 之 和 递增 的 顺序 列 出 所 有 二 元 组 。 


allPairs = [(x,d-x) | du <- [0..], x <- [0..d]] 


习题 C 答案 


定义 如 下 : 


disjoint xs [] = True 
disjoint [] ys = True 
disjoint xs'@(x:xs) ys'Q@(y:ys) 

| x <y = disjoint xs ys' 

| x ==y = False 

| x >y = disjoint xs' ys 


为 了 使 得 定义 更 聪明 ， 这 里 使 用 了 等 同 模式 。 


习题 D 答案 


只 有 ys 是 有 穷 列表 时 ， 它 们 的 结果 才 相 同 : 


ghci> [1 | x <- [1,3], even x, y <- undefined] 


[] 


ghci> [1 | x <- [1,3], y <- undefined, even Xx] 
水 冰 水 Exception: Prelude.undefined 
ghei> [| 美人 [1,3], evea x, 7 <- [tj 


[] 


Prelude> [1 | x <- [1,3], y <- [1..], even x] 


{Interrupted} 


当 它 们 结果 相同 时 ， 前 者 更 高 效 。 


习题 E 答案 


一 种 生成 本 质 不 同 的 四 元 组 方法 是 限制 四 元 组 (a, b,c，d) 满足 条 件 


4 和、c 和 dd 以 及 a<c。 因 此 


quads n = [(a,b,c,d) | a <- [1..n]，b<- [a..n], 


c <- [a+l..Dn] ,d <- [c..n],， 
a“3+ b"3 == c“ 3 + d“3] 


第 二 个 这 样 的 数 是 4104 =2” +16” =9” +15”。 


习题 F 答案 


head :: List a -> a 
head (Snoc Nil x) = x 
head (Snoc xs x) = head xs 
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下 列 


则 有 


如 果 


last :: List a -> a 
last (Snoc xs X) = x 


toList :: [a] -> List a 
toList = convert . reverse 
Where convert [] = Nil 
convert (x:xs) = Snoc (convert xs) x 
fromList :: List a -> [al 
fromList = reverse . convert 
where convert Nil = [] 
convert (Snoc xs X) = x:convert xs 


习题 G 答案 ”因为 在 内 存 中 需要 构建 下 列表 达 式 ， 故 所 需 的 空间 是 线性 的 。 

1+ (1+ (1+... (+0))) 

在 惰性 求 值 策略 下 ，1length 的 第 二 个 定义 的 空间 需求 不 变 ， 因 为 在 内 存 中 需要 构建 
表达 式 : 


loop ((((0 + 1) + 1) + 1 ... +1),[]) 


但 是 在 勤奋 求 值 策略 下 ， 一 个 列表 的 长 度 可 以 使 用 额外 的 常数 空间 计算 出 来 。 


习题 H 答案 
take, drop :: Int -> [a] -> [al 
take n [] = [] 


take n (x:xs) = if n==0 then [] else x:take (n-1) xs 


drop n [J = [] 
drop n (x:xs) = if n==0 then x:xs else drop (n-1) xs 


按照 take 的 这 个 定义 则 有 


take undefined [] = [] take 0 undefined = undefined 


利用 take 的 男 外 定义 : 
take n xs | n==0 = [] 
| null xs = [0] 
| otherwise = head xs: take (n-1) (tail xs) 


take undefined [] = undefined take 0 undefined = [] 

对 这 个 复杂 问题 的 答案 是 否定 的 。 参 数 n 或 者 参数 xs 必须 被 检查 ， 无 论 哪个 在 先 ， 
该 参数 的 结果 是 上 ， 则 最 后 结果 是 1。 

无 论 哪 个 定义 ， 所 有 4 个 等 式 对 于 所 有 列表 xs 和 所 有 m、n 都 成 立 ， 其 中 m、 


7 天 上。 


图 数 splitAt n 可 以 定义 如 下 : 


SplivAt: 3 Tot => [a] => (Lal, Lal) 

splitAt n [] = ([],[]) 

splitAt n (x:xs) = if n==0 then ([] ,x:xs) else (x:ys,2Zs) 
Where (ys,2zs) = splitAt (n-1) xs 


习题 | 答案 同意 3、4、5 和 7。 
习题 J 答案 ”唯一 错误 的 等 式 是 map f . sort = sort . map f， 该 等 式 只 有 在 f 保 


a 


序 的 情况 下 成 立 ， 即 x<y=f<fy。 


习题 K 答案 
unzip :: [(a,b)] -> ([a], [bj]) 
Cross 2 (as =>'b, € => = usc) ~> kbvd) 
计算 过 程 如 下 : 
cross (map f, map g) . unzip 
= {unzip 的 定义 } 
cross (map f, map g) . fork (map fst, map snd) 
= {cross 和 fork 的 定律 } 
fork (map f . map fst, map g& . map snd) 
= {map 的 定律 } 
fork (map (f . fst), map (g . snd)) 


看 似 卡 住 了 ， 因 为 没有 规则 可 用 。 再 尝试 计算 等 式 右边 : 
unzip . map (cross (f,g)) 
= {unzip 的 定义 } 
fork (map fst, map snd) . map (cross (f,g)) 
= {fork 定律 } 
fork (map fst . map (cross (f,g)), 
map snd . map (cross (f,g))) 


= {map 定 律 } 
fork (map (fst . cross (f,g)), 
map (snd . cross (f,g))) 


= {fst 和 snd 的 定律 } 
fork (map (f . fst), map (g . snd)) 


好 啊 ， 等 式 两 边 都 化 简 到 了 同一 个 表达 式 。 这 也 是 常用 的 计算 方法 : 等 式 的 一 边 并 不 
总 是 很 容易 化 简 成 另 一 边 ， 但 是 两 边 可 以 化 简 到 同一 个 式 子 。 

目前 看 到 的 计算 都 是 在 函数 层 进行 的 。 这 种 风格 的 定义 和 证 明 称 为 点 自由 的 (point- 
free， 也 有 人 戏称 为 无 意义 的 (pointless) ) 。 第 12 章 的 自动 计算 器 产生 点 自由 证 明 。 点 自 
由 风格 非 党 灵活， 但 是 这 种 风格 必须 使 用 各 种 管道 套 结 组 合子 (plumbing combinator) 为 
哺 数 传递 参数 ， 如 fork 和 cross。 套 结 组 合子 可 以 推送 值 ， 重 复 它 们 ， 甚 至 删除 它们 。 
最 后 一 种 组 合子 的 例子 如 : 

const :: a -> b -> 8 

const XY = x 
这 个 组 合子 在 标准 引导 库 中 有 定义 ， 有 时 非常 有 用 。 

标准 引导 库 中 定义 的 男 外 两 个 套 结 组 合子 是 curry 和 uncurry: 

curry :: ((a, b) -> c) ->a->b->c 


CE £ XT = (Ly) 


Uncurry :: (a -> b -> C) -> (a,b) -~> C 
uncurry f (x,y) = f xy 


一 个 卡 瑞 化 (curried) 的 函数 每 次 取得 一 个 参数 ， 而 非 卡 瑞 化 (non-curried) 的 函数 
一 次 取得 用 多 元 组 表示 的 参数 。 卡 瑞 化 函数 的 主要 优点 是 函数 可 以 部 分 应 用 (partially ap- 
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plied) 。 例 如 ，take n 本 身 是 完全 合理 的 函数 ，map f 同样 是 一 个 函数 。 这 也 是 一 开始 驶 
使 用 卡 瑞 化 函数 的 原因 。 
顺便 说 明 的 是 ， 卡 瑞 化 函数 是 以 美国 逻辑 学 家 Haskell B. Curry 命名 的 。 是 的 ，Haskell 
也 是 这 样 命名 的 。 
习题 L 答案 
cross (f,g) . cross (h,k) 
= {definition of cross} 
cross (f,g) . fork (h . fst, k . snd) 
= {law of cross and fork} 
fork Af » kh » tst,g' . Ek . 300) 
= {definition of cross} 
cross (f . h, g& . k) 


另 有 cross = uncurry bimap， 其 中 uncurry 如 习题 K 答案 中 定义 。 
下 面 是 Either 的 实例 定义 : 


instance Bifunctor Either where 
bimap f g (Left x) = Left (f x) 
bimap f g (Right y) = Right (g y) 


4. 11 注 记 


本 蕴 介 绍 的 大 多 数 函 数 都 可 以 在 Haskell 标准 引导 库 中 找到 。 函 子 、 双 函 子 以 及 自然 
变换 的 解释 可 以 在 有 关 范 畴 论 书 中 找到 ， 这 里 列 出 两 本 : Benjamin Pierce 编著 的 《Basic 
Category Theory for Computer Scientists》( MIT Press，1991 ) 、Richard Bird 和 Oege de Moor 编 
车 的 《The Algebra of Programming》 (Prentice Hall，1997 ) 。 

关于 定律 内 容 ， 请 参见 Phil Wadler 的 著名 文章 “Theorem for free1”， 可 在 下 列 链接 
找到 : 

homepages. inf. ed. ac. uk/wadler/ papers/ free/ 

数学 上 的 所 谓 的 士 数 taxicab (n) 是 能 够 用 种 方法 表示 成 两 个 正 整数 立方 和 的 最 小 
88 数 ， 如 1729 是 taxicab(2)。 关 于 士 数 的 更 多 信息 请 搜索 “taxicab numbers”。 
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数 独 玩法 : 在 一 个 9 x9 的 棋盘 上 填写 数字 1 ~9 使 得 每 一 行 、 每 一 列 和 每 个 3 x3 的 
方 格 都 包含 1 ~9。 解 决 这 个 谜 题 无 需 数 学 知识 ， 但 是 需要 推理 和 逻辑 知识 。 
一 一 摘自 《独立 报 》“ 玩 数 独 的 建议 ” 


本 章 主题 是 一 个 扩展 练习 ， 使 用 列表 解决 问题 ， 使 用 等 式 推理 对 程序 推理 ， 并 改进 其 
性 能 。 

数 独 游戏 在 9 x9 棋盘 上 玩 ， 不 过 其 他 规格 的 棋盘 也 可 以 
玩 。 给 定 一 个 矩阵 ， 如 图 5-1 所 示 ， 解 法 是 用 数字 1 ~9 填充 
空格 ， 使 得 每 一 行 、 每 一 列 和 每 个 3 x 3 的 方 格 都 包含 1 ~9。 
一 般 来 讲 ， 一 个 数 独 可 能 有 许多 解 ， 但 是 一 个 好 的 数 独 迹 题 应 
该 总 是 有 唯一 解 。 本 章 的 目的 是 设计 一 个 解数 独 的 程序 。 特 别 
地 ， 将 定义 一 个 函数 solve 用 于 计算 完成 一 个 给 定 谜 题 的 所 
有 可 能 填充 方法 的 列表 。 如 果 只 需要 一 个 解 ， 那 么 只 要 取 列表 人 
的 第 一 个 元 素 即 可 。 对 于 惰性 计算 ,这 也 意味 着 只 计算 出 第 一 
个 结果 。 图 5-1 数 独 棋盘 

下 面 先 从 问题 的 说 明 开始 ， 然 后 使 用 等 式 推理 计算 更 有 效 的 解 。 这 里 无 需 数学 ， 只 需 
要 推理 和 逻辑 。 


5.1 问题 说 明 
下 面 是 相关 的 基本 数据 类 型 ， 首 先是 矩阵 : 


type Matrix a = [Row a] 
type Rowa = [a] 


两 个 类 型 同义词 仅仅 说 明 ，Matrix a 是 [[a]] 的 同义词 。 但 是 , 说 明 的 方法 强调 了 
一 个 矩阵 是 行 的 列表 ， 更 准确 地 说 ,一 个 mxn 和 矩阵 是 m 个 行 的 列表 ， 每 行 均 是 长 度 为 nn 
的 列表 。Haskell 类 型 同义词 不 能 强加 这 些 约束 ,但 是 能 够 表达 这 种 约束 的 语言 ， 称 为 依 
存 类 型 (dependent-typed) 语言 。 

一 个 棋盘 是 一 个 9 x9 的 数字 和 矩阵 : 

type Grid = Matrix Digit 

type Digit = Char 

合法 的 数字 是 1 ~9，0 表示 空白 : 


digits :: [Char] 
dts w= LI 5 9 





EL 
LT 
3 8 
26 
| 
LT 93 
| 











blank :: Digit -> Bool 
blank = (== '0') 
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注意 Char 也 是 类 族 Enum 的 实例 ， 所 以 ['1' .. '9'] 是 合法 表达 式 ， 且 表示 非 零 
数字 列表 。 

为 简单 起 见 ， 假 定 棋盘 只 包含 数字 和 空 折 ,这 样 就 无 需 检 查 棋盘 是 否 有 意义 。 但 是 ， 
是 否 需 要 假定 非 空白 格 的 数字 在 每 行 、 每 列 或 者 每 个 方 格 中 不 会 重复 ? 如 果 有 重复 ， 那 么 
这 样 的 谜 题 无 解 。 现 在 暂时 抛 开 这 个 问题 ， 符 看 到 解决 问题 的 算法 如 何 展 开 后 再 做 决定 。 

和 完 看 问题 说 明 。 目 标 是 写 出 最 简单 而 且 最 清晰 的 说 明 ， 先 不 考虑 结果 的 效率 。 这 是 也 
数 式 程序 设计 与 其 他 形式 程序 设计 的 关键 区 别 : 总 是 可 以 从 一 个 清晰 而 且 简 单 ， 尽 管 可 能 
效率 极 低 的 solve 定义 开始 ， 然 后 应 用 函数 式 程序 设计 中 的 定律 修改 计算 ,使 其 满足 时 
间 和 空间 上 的 要 求 。 

一 种 方法 是 首先 构造 一 个 包含 所 有 正确 填充 棋盘 的 列表 ， 该 列表 可 能 相当 长 ， 但 依然 
是 有 穷 的 ， 然 后 将 给 定 的 棋盘 与 列表 中 每 个 棋盘 对 照 ， 找 出 与 给 定 棋盘 非 空 白 格 上 数字 一 
致 的 棋盘 。 显 然 ， 这 种 方法 已 将 非 有 效 说 明 用 到 极致 。 另 一 种 合理 的 方法 是 在 给 定 的 棋盘 
上 给 每 个 空 日 填写 所 有 可 能 的 数字 ， 结 果 是 一 个 填 满 的 棋盘 列表 ， 然 后 可 以 在 此 列表 中 过 
滤 出 那些 每 行 、 每 列 和 每 块 都 不 含 重复 数字 的 棋盘 。 这 种 说 明 的 实现 方法 如 下 : 

solve :: Grid -> [Grid] 

solve = filter valid . completions 
其 中 的 辅助 函数 具有 下 列 类 型 : 


completions :: Grid -> [Grid] 
Valid  :: Grid -> Bool 


首先 考虑 completions ， 然 后 考虑 valid。 一 种 定义 completions 的 方法 是 采用 
两 步 过 程 : 

completions = expand . choices 
其 中 : 

choices :: Grid -> Matrix [Digit] 

expand :: Matrix [Digit] -> [Grid] 

函数 choices 为 每 个 棋盘 位 置 安放 了 可 能 的 数字 : 


choices = map (map choice) 
choice d = if blank d then digits else [d] 


如 果 一 个 位 置 是 空 日 ， 那 么 所 有 的 数字 都 作为 可 用 选择 ; 否则 只 有 一 个 选择 ， 故 返回 
单元 素 列 表 。 如 果 想 把 函数 £ 应 用 于 和 矩阵 的 每 个 元 素 ， 需 要 使 用 的 函数 是 map (map f)， 
因为 一 个 矩阵 只 是 一 个 列表 的 列表 。 

应 用 choices 后 获得 一 个 矩阵 ， 和 矩阵 的 每 个 元 素 是 一 个 数字 列表 。 接 下 来 要 做 的 是 
定义 一 个 图 数 expandQ， 通 过 用 所 有 可 能 的 方式 填写 棋盘 ， 将 该 矩阵 转换 为 棋盘 列表 。 这 
个 任务 看 似 难 以 想象 ， 所 以 先 考虑 一 个 更 简单 的 问题 ， 这 里 不 是 9 x9 的 矩阵 ， 而 是 一 个 
长 度 为 3 的 列表 。 假 设 要 把 下 列 列表 : 


[[1,2,3] , [2] , [1,3]] 


转换 为 列表 : 


L[452,4] ; [1,2,.3] » (2251 3 [2,2,3] 3 [13525 3 [3,2,3]] 
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第 二 个 列表 中 每 个 列表 产生 的 方法 : 用 各 种 可 能 的 方法 在 第 一 个 列表 中 取 一 个 元 素 ， 
在 第 二 个 列表 中 取 一 个 元 素 ， 在 第 三 个 列表 中 取 一 个 元 素 。 假 设 用 cp 〈( 笛 卡 儿 积 的 简写 ， 
以 上 列表 也 是 数学 家 所 称 的 笛 卡 儿 积 ) 表示 这 样 的 函数 。 似 乎 看 不 出 使 用 其 他 函数 计算 
cp 的 聪明 方法 ， 所 以 仍然 使 用 惯用 的 方法 ， 即 将 参数 分 为 两 种 可 能 的 情况 ， 一 种 是 空 列 
表 [] ， 另 一 种 是 非 空 列表 xs :xss。 如 果 先 猜想 cp [] 的 定义 ， 或 许 会 摘 错 ， 最 好 是 先 考 
虑 第 二 种 非 空 列表 的 定义 。 假 设 有 

cp [[2] ,[1,3]] = [[2,1], [2,3]] 


如 何 将 这 个 定义 扩充 到 cp ([1,2,3]:[[2], [1,3]])? 答案 是 将 1 置 于 cp [[2]， 
[1 ,3 ] ] 的 每 个 元 素 之 前 ， 然 后 将 2 置 于 该 列表 的 每 个 元 素 之 前 ， 最 后 将 3 置 于 同一 个 列 
表 的 每 个 元 素 之 前 。 这 个 过 程 可 以 用 列表 概括 清晰 地 表达 出 来 : 


cp (xs:xss) = [x:ys | x <- xs, ys <- cp xss] 


换言之 ,将 xs 的 每 个 元 素 置 于 cp xss 的 每 个 元 素 之 前 。 
如 果 读 者 对 低 效率 有 很 敏锐 的 嗅觉 ， 则 会 发 现 这 样 用 一 行 来 表达 不 是 最 好 的 方法 ， 事 
情 确实 如 此 。7. 3 节 将 对 此 进行 深入 讨论 ， 不 过 现在 可 以 给 出 一 种 更 高 效 的 定义 : 


cp (xs:xss) = [x:ys | x <- xs, ys <- yss] 
Where yss = cp XSS 


这 种 定义 确保 cp xss 只 计算 一 次 。 
再 返回 来 看 ， 如 何 定 义 cp [] 呢 ? 答案 并 非 [] ， 而 是 [[] ] 。 为 了 看 清楚 为 什么 [] 是 
错误 的 ， 考 虑 下 列 计算 : 


cp [xs] = cp (xs:[]) 
= [x:ys | x <- xs, ys <- cp 口 ] 


“ [xys | xX <= XB; y5 <= [j] 

= [] 

事实 上 ,如 果 cp [] = []， 那么 可 以 证 明 对 于 所 有 列表 xss 都 有 cp xss = []。 
所 以 ， 第 一 个 定义 显然 是 错误 的 。 读 者 可 以 验证 第 二 个 答案 [[] ] 确实 能 给 出 正确 的 答案 。 

综 上 所 述 ， 现 在 可 以 将 cp 定义 为 


cp ss Llul] => [lal] 

cp [DD = [[]] 

cp (xs:xss) = [x:ys | x <- xs, ys <- yss] 
Where yss = cp XSS 


例如 : 


ghci> cp [[1] 四 [2] 日 [3]] 
[Et,2,31] 


ghci> cp [[1,2] ,[] , [4,5]] 
0 
对 于 第 二 个 例子 ， 因 为 在 中 间 的 列表 中 没有 可 选 元 素 ， 所 以 结果 是 空 列表 。 


但 是 如 何 处 理 和 矩阵 和 德 阵 上 类 似 于 cp 的 函数 expang 呢 ? 读者 需要 思考 一 下 ， 然 后 
才能 弄 清楚 expand 需要 完成 的 是 
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expand :: Matrix [Digit] -> [Grid] 

expand = cp . map cp 
这 看 起 来 有 点 神秘 ,但 是 map cp 返回 每 行 所 有 可 能 选择 的 列表 。 因 此 ， 在 此 结果 上 应 用 
cp 之 后 得 到 棋盘 的 所 有 可 能 选择 。 定 义 右边 的 一 般 类 型 是 

cp . map cp :: [[[a]l]] -> [[[al]] 


而 expand 声明 的 类 型 只 是 一 般 类 型 的 一 种 限制 版 本 。 注 意 ， 如 果 任 意 一 行 的 任何 元 素 是 
空 列表 ， 那 么 expand 返回 空 列表 。 
最 后 ,一 个 合理 的 棋局 是 所 有 行 、 列 或 者 块 都 没有 重复 数字 出 现 : 


valid :: Grid -> Bool 

valid g = all nodups (rows g) && 
all nodups (cols g) &g& 
all nodups (boxs g) 


引导 库 函 数 all 有 如 下 定义 : 


all p= and . map P 


将 all p 应 用 于 一 个 有 穷 列表 xs 时 ， 如 果 列 表 中 所 有 元 素 满 足 p， 则 结果 是 True， 
否则 结果 是 False。 函 数 nodups 可 以 如 下 定义 : 

nodups :: (Eq a) => [a] -> Bool 

nodups [] = True 

nodups (x:xs) = all (/=x) xs && nodups xs 

将 nodups 应 用 于 长 度 为 n 的 列表 所 花费 的 时 间 与 mn 成 正比 。 另 一 种 方法 是 将 列表 
排序 ， 然 后 检查 有 序列 表 严 格 递增 。 排 序 可 以 在 nlogn 的 常数 倍 时 间 完 成 。 看 起 来 后 一 种 
方法 比 前 一 种 方法 大 大 节省 了 时 间 。 但 是 ， 对 于 n=9 的 情况 使 用 有 效 的 排序 是 否 值得 ， 
答案 并 不 清楚 。 问 题 是 ，2n 步 和 100nlogsn 步 哪 个 更 好 ? 

剩余 的 任务 是 定义 函数 rows 、cols 和 boxs。 如 果 一 个 矩阵 用 行 的 列表 表示 ， 那 么 
rows 只 是 矩阵 上 的 恒 等 函 数 : 


TOWS :: Matrix a -> Matrix a 
rows = id 


明 数 cols 计算 矩阵 的 转 置 。 所 以 ， 如 果 一 个 和 矩阵 有 m 行 ， 每 行 长 度 为 n+， 那么 转 置 
矩阵 有 nn 行 ， 每 行 长 度 为 m。 假设 m 和 均 不 为 0， 则 可 定义 : 

cols :: Matrix a -> Matrix a 

cols [xs] = [[x] | x <- xs] 

cols (xs:xss) = ZipWith (:) xs (cols xss) 

通常 在 矩阵 代数 中 假设 矩阵 非 空 ， 以 上 定义 足以 满足 这 里 的 应 用 。 但 是 ， 有 趣 的 是 m 
或 者 为 0 时 会 出 现 什么 情况 。 该 问题 将 在 习题 中 考虑 。 

函数 boxs 的 定义 更 有 趣 。 下 面 先 给 出 定义 ， 然 后 再 解释 。 


boxs :: Matrix a -> Matrix a 
boxs = map ungroup . ungroup . 
map cols . 


group . map group 


其 中 函数 group 将 列表 以 3 个 元 素 为 一 组 划分 为 组 的 列表 : 
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group :: [a] -> [[a]] 

group [] = [] 

group xs = take 3 xs:group (drop 3 xs) 

图 数 upgroup 将 分 组 的 列表 转换 为 不 分 组 列表 : 


ungroup :: [[a]] -> [a] 
ungroup = concat 


在 4 x4 的 情况 下 ，group 将 列表 两 两 一 组 划分 而 不 是 3 个 一 组 时 ， 函 数 boxes 的 作 
用 如 下 图 所 示 。 


a bc d ab cd 
e 三 gg h | ef | 
i 7 kk 1 yy kl 
m n op | mn | 

上 | 
a b e ff ab ef 
Cd gg h | cd a 
i 7 现 坑 i mn 
k 0 P | kl op 


可 以 看 出 ， 分 组 生成 一 个 矩阵 列表 ， 转 置 其 中 每 个 矩阵 ， 然 后 合并 分 组 生成 2x2 块 ， 
其 中 矩阵 行 是 原 矩 阵 中 的 2x2 块 。 


5.2 合法 程序 的 构造 


请 注意 ， 代 之 以 用 下 标 表 示 和 拖 阵 ， 通 过 计算 下 标 确 定 行 、 列 和 块 ， 这 里 定义 的 函数 均 
把 矩阵 本 身 作为 一 个 整体 来 处 理 。 这 种 风格 被 形象 地 称 为 全 麦 面粉 程序 设计 (wholemeal 
programming)。 全 麦 面粉 程序 设计 对 健康 有 益 ， 它 帮助 人 们 避免 一 种 称 为 过 度 下 标的 疾病 ， 
并 且 鼓 励 合法 程序 的 构造 。 

例如 ， 下 面 是 数 独 棋盘 上 成 立 的 3 个 定律 : 


rOWS . rows = id 
cols . cols = id 
boxs . boxs = id 


换 句 话说 ，3 个 函数 都 是 对 合 。 前 两 个 等 式 对 于 任意 矩阵 成 立 ， 第 三 个 等 式 对 于 任意 
nxn 阶 矩阵 成 立 〈 只 要 将 group 的 定义 改 为 按照 n 进行 分 组 )。 这 里 有 两 个 等 式 的 证 明 
简单 ， 但 是 有 一 个 证 明 比 较 难 。 难 证 的 不 是 读者 想象 的 关于 boxs 的 定律 ， 而 是 关于 
cols 的 对 合 性 质 。 尽 管 直 观 上 对 和 矩阵 两 次 转 置 得 到 原 矩 阵 是 显然 的 ， 但 是 根据 cols 的 
定义 来 证 明 有 点 难度 ， 这 里 不 给 出 证 明 的 细节 ， 主 要 原因 是 目前 还 没有 讨论 完成 这 个 证 明 
的 工具 。 

相 比 之 下 ， 下 面 是 boxs 的 对 合 性 质证 明 。 证 明 可 以 通过 简单 的 等 式 推理 完成 。 证 明 
中 使 用 了 各 种 定律 ， 包 括 map 的 函 子 定律 ，ia 是 复合 的 单位 元 ， 以 及 下 列 事实 : 


ungroup . group = id 
group . ungroup = id 
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第 二 个 等 式 只 有 在 分 组 列表 上 成 立 ， 但 这 将 是 下 面 计 算 所 满足 的 条 件 。 

下 面 将 叙述 证 明 过 程 ， 不 再 给 出 证 明 的 每 个 细节 。 出 发 点 是 用 boxs 的 定义 重 写 
boxs . boxs: 

map ungroup . ingroup . map cols . group . map group . 

map ungroup . ungroup . map cols . group . map group 
利用 map 的 函 子 律 和 group 与 ungroup 互 逆 的 性 质 ， 中 间 的 表达 式 map group . map 
ungroup 化 简 为 ia。 由 此 得 到 

map ungroup . ungroup . map cols . group . 

ungroup . map cols . group . map group 
使 用 group . ungroup = id 得 到 


map ungroup . ungroup . map cols . 
map cols . group . map group 


由 map 的 函 子 律 和 cols 的 对 合 性 质 得 到 
map ungroup . ungroup . group . map group 

再 利用 ungroup . group = id 两 次 即 可 完成 证 明 。 可 以 看 出 ， 这 是 一 个 很 简单 的 计算 。 
下 面 是 在 N x 选择 矩阵 上 成 立 的 另外 3 个 定律 : 


map TOWS . expand = expand . rows 
map cols . expand = expand . cols 
map boxs . expand = expand . boxs 


稍 后 会 用 到 这 些 定律 。 

最 后 ， 下 面 是 关于 cp 的 两 个 定律 : 

map (map f) . cp = cp . map (map if) 

filter (all p) . cp = cp . map (filter p) 
第 一 个 定律 (自然 律 ) 是 由 cp 的 类 型 蕴涵 的 ， 在 第 4 章 也 出 现 过 类 似 的 定律 。 第 二 个 定 
律 表 示 ， 对 一 个 列表 的 列表 做 笛 卡 儿 积 ， 然 后 保留 所 有 元 素 满 足 性 质 p 的 列表 ， 实 现 这 一 
过 程 的 另 一 种 方法 是 ， 首 先 过 滤 原 列表 ， 只 保留 满足 性 质 p 的 元 素 ， 然 后 做 笛 卡 儿 积 。 如 
前 面 句子 所 示 ， 一 个 等 式 胜 过 千言 万 语 。 


5.3 修剪 选择 矩阵 
总 结 现在 的 成 果 ， 有 


solve :: Grid -> [Grid] 

solve = filter valid . expand . choices 
虽然 理论 上 是 可 运行 的 ， 但 是 solve 的 这 个 定义 是 不 现实 的 。 假 如 81 格 中 有 20 个 已 经 
填充 ， 那么 共有 9" 个 格子 ,或 者 


ghci> 9°61 
16173092699229880893718618465586445357583280647840659957609 


需要 查看 这 么 多 格子 ! 所 以 需要 更 好 的 方法 。 
为 了 得 到 更 有 效 的 求解 锋 ， 显 然 的 想法 是 去 除 一 个 格子 的 那些 选择 c， 这 些 选 择 c 已 
经 作为 单元 素 填充 出 现在 该 格子 所 在 的 行 、 列 和 块 中 。 一 个 单元 素 填 充 对 应 于 一 个 已 经 确 
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定 的 选择 。 因 此 需要 寻找 一 个 函数 : 

prune :: Matrix [Digit] -> Matrix [Digit] 
使 得 

filter valid . expand = filter valid . expand . prune 

如 何 定义 函数 prune 呢 ? 因为 一 个 矩阵 是 行 的 列表 ， 所 以 ， 先 对 行 裁剪 是 好 的 开端 。 
果 数 pruneRow 定义 如 下 : 


pruneRow :: Row [Digit] -> Row [Digit] 
pruneRow row = map (remove fixed) row 


where fixed = [d | [d] <- row] 


确定 的 选择 是 每 行 中 的 单元 素 选 择 。 其 中 fixed 的 定义 使 用 了 包含 模式 的 列表 概括 : 
row 的 元 素 如 果 不 是 单元 素 模式 则 被 丢弃 。 
消 数 remove 从 未 确定 的 选择 中 删除 了 已 确定 的 选择 : 


remove :: [Digit] -> [Digit] -> [Digit] 
remove ds [x] = [x] 
remove ds xs = filter (‘notElem. ds) xs 


标准 引导 库 函 数 notElem 定义 如 下 : 
notElem :: (Eq a) => a -> [a] -> Bool 
notElem x xs = all (/= x) xs 

下 面 是 函数 pruneRow 应 用 的 几 个 例子 : 
ghci> pruneRow [[6],[1,2],[3],[1,3,4],[5,6]] 
[[6] , [1,2] , [3] , [1,4], [5]] 


ghci> pruneRow [[6], [3,6], [3] , [1,3,4] , [4] ] 
[LL6] ,Es 的 JJ 


在 第 一 个 例子 中 ，[6] 和 [3] 是 已 确定 的 选择 ， 删 除 这 些 选择 后 使 得 最 后 一 个 格子 变 
成 了 确定 选择 。 在 第 二 个 例子 中 ， 删 除 确定 选择 使 得 第 二 个 填充 变 成 空 选择 列表 。 
曙 数 pruneRow 满足 等 式 : 


filter nodups . cp = filter nodups . cp . pruneRow 


换 和 名 话说， 这 个 等 式 表 示 裁 前 一 行 不 会 舍弃 不 含 重复 元 素 的 列表 。 稍 后 会 用 到 这 个 性 质 。 
现在 几乎 可 以 进行 确定 函数 prune 的 定义 了 。 几 乎 是 , 但 不 完全 是 ， 因 为 还 需要 为 
外 两 个 性 质 : 如 果 f£ . £ = ia， 那么 


filter (p . f) = map f . filter p . map f 
filter (p . f) . map f = map f . filter p 


第 二 个 可 由 第 一 个 推出 (为什么?)。 下 面 是 第 一 个 性 质 的 证 明 : 
map f . filter p . map ff 
= {第 4 章 证 明了 
filter p . map f = map f . filter (p . f)} 
map f . map f . filter (p . f£) 
= {map 的 算 子 律 以 及 f . f = id} 
filter (p . f) 
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现在 进行 主要 部 分 计算 。 出 发 点 是 使 用 valida 的 定义 重 写 表达 式 filter . valid . 
expand: 


filter valid . expand 
= filter (all nodups . boxs) . 
filter (all nodups . cols) . 
filter (all nodups . rows) . expand 


过 滤器 在 右边 出 现 的 顺序 不 重要 。 解 决 的 方案 是 将 每 个 过 滤器 送 到 与 expand 的 战斗 中 。 
例如 ， 在 块 的 情况 中 可 以 计算 : 
filter (all nodups . boxs) . expand 
= {根据 上 面 filter 的 定律 ， 因为 boxs . boxs = id} 
map boxs . filter (all nodups) . map boxs . expand 
= {因为 map boxs . expand = expand . boxs} 
map boxs . filter (all nodups) . expand . boxs 
= {expand 的 定义 } 
map boxs . filter (all nodups) . cp . map cp . boxs 
= {因为 filter (all p) . cp = cp . map (filter p)} 
map boxs . cp . map (filter nodups) . map cp . boxs 
= {map 的 函 子 律 } 
map boxs . cp . map (filter nodups . cp) . boxs 


现在 可 以 使 用 性 质 : 
filter nodups . cp = filter nodups . cp . pruneRow 
然后 重 写 最 后 的 表达 式 : 
map boxs . cp . map (filter nodups . cp . pruneRow) . boxs 


余下 的 步骤 基本 上 重复 以 上 计算 ， 不 过 用 相反 的 次 序 : 


map boxs . cp . map (filter nodups . cp . pruneRow) . 
boxs 


= {map 的 函 子 律 } 

map boxs . cp . map (filter nodups) . 

map (cp . pruneRow) . boxs 

= {因为 cp . map (filter p) = filter (all p) . cp} 
map boxs . filter (all nodups) . cp . 

map (cp . pruneRow) . boxs 


= {map 的 函 子 律 } 
map boxs . filter (all nodups) . 
cp . map cp . map pruneRow . boxs 
= {expand 的 定义 } 
map boxs . filter (all nodups) . 
expand . map pruneRow . boxs 
= {filter 的 定律 ， 因 为 boxs . boxs = id} 
filter (all nodups . boxs) . map boxs . 
expand . map pruneRow . boxs 
= {因为 map boxs . expand = expand . boxs} 
filter (all nodups . boxs) . expand ， 
boxs . map pruneRow . boxs 
= { 引 入 pruneBy f = f . pruneRow . f} 
filter (all nodups . boxs) . expand . pruneBy boxs 
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我 们 已 经 证 明了 ， 


filter (all nodups . boxs) . expand 
= filter (all nodups . boxs) . expand . pruneBy boxs 


其 中 pruneBy f = f . map pruneRow . f。 重 复 对 行 和 列 的 计算 ， 可 以 得 到 


filter valid . expand = filter valid . expand . prune 


其 中 : 


prune = pruneBy boxs . pruneBy cols . pruneBy rows 


总 结 起 来 ，solve 先前 的 定义 可 以 用 以 下 新 定义 代替 : 


solve = filter valid . expand . prune . choices 


事实 上 ， 裁 芒 不 仅 做 一 次 ， 而 是 可 以 根据 需要 做 很 多 次 。 这 样 做 是 合理 的 ， 因 为 一 轮 
裁剪 后 有 些 选择 可 能 变 成 了 单元 系 选择 ， 表 一 轮 裁 冀 又 删除 了 更 多 不 可 能 的 选择 。 
所 以 ， 可 以 定义 : 


many :: (Eq a) => (a -> a) ->a->a 
many f x = if x == y then x else many f y 
where y= fx 


然后 再 次 重 定义 solve 为 


solve = filter valid . expand . many prune . choices 


最 简单 的 数 独 问题 的 解决 方法 是 不 停 地 裁 甬 选择 和 矩阵， 下 至 最 后 只 剩 下 单元 素 选 择 。 


5. 4 ”格子 的 扩展 


many prune . choices 的 结果 是 选择 的 矩阵 ， 可 以 分 成 下 列 三 类 . 

1. 一 个 完全 的 矩阵， 其 中 每 个 元 素 都 是 单个 选择 。 在 这 种 情况 下 ，expang 将 抽取 一 
个 棋盘 用 于 检查 其 有 效 性 。 

2. 一 个 含 元 素 为 空 选择 列表 的 和 矩阵。 在 这 种 情况 下 expang 将 生成 空 列表 。 

3. 一 个 不 含 空 选择 列表 的 和 矩阵， 但 是 某 些 元 素 包 含 两 个 以 上 的 选择 。 

问题 是 如 何 处 理 第 三 类 矩阵。 为 一 种 合理 方法 是 不 进行 完全 扩展 ， 而 是 在 仅 对 矩阵 的 
一 个 元 系 做 了 扩展 的 矩阵 上 进行 裁 前 。 希 望 单 格 扩 展 与 裁剪 的 混合 能 够 产生 一 个 更 快 的 
解 。 因 此 ， 目 的 是 构造 一 个 只 对 单 格 扩展 的 部 分 函数 : 
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该 函数 只 对 不 完全 矩阵 返回 确定 的 结果 ， 而 且 在 这 些 矩 阵 上 满足 


expand = concat . map expand . expandl 


事实 上 这 个 列表 间 的 等 式 过 强 。 人 们 希望 保证 部 分 扩展 不 会 失掉 可 能 的 选择 ， 但 是 并 不 真 
正 关 心 等 式 两 边 生 成 结果 的 次 序 。 所 以 ， 将 以 上 等 式 解释 为 两 边 在 进行 置换 后 相等 。 

应 该 在 哪个 格子 上 进行 扩展 呢 ? 简单 的 方法 是 从 矩阵 的 第 一 个 非 单 选择 元 素 开 始 。 设 
想 一 个 矩阵 rows 分 解 成 如 下 形式 : 


rows = rowsl ++ [row] ++ rows2 
row = Towl ++ [cs] ++ Tow2 
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其 中 格子 cs 是 row 中 的 非 单元 系 选 择 列表 ， 而 row 又 是 矩阵 rows 中 的 一 行 。 
那么 可 以 定义 : 


expand1 :: Matrix [Digit] -> [Matrix [Digit]] 
expandi1 rows 
= [rowsl ++ [rowl ++ [cj] :row2] ++ rows2 | ¢ <- cs] 


为 了 将 矩阵 分 解 成 以 上 形式 ,使 用 引导 库 函 数 break: 
break :: (a -> Bool) -> [a] -> ([al], [a]) 
break p = span (not . p) 
其 中 函数 span 在 4.8 节 定 义 。 例 如 : 
ghci> break even [1,3,7,6,2,3,5] 
(LL,3,.73,16,2,.3,5]) 
还 需要 标准 引导 库 图 数 any ， 其 定义 为 
any :+ (a -> Bool) => [Ba -~> Bool 
any P = or . map P 
其 中 or 的 参数 是 一 个 布尔 值 列 表 ， 如 果 列 表 中 任何 元 素 为 True， 则 返回 True， 和 否则 返 
回 False: 


or :: [Bool] -> Bool 
or [] = False 
or (x:xs) = x || or xs 


最 后 ,测试 single 的 定义 (使 用 不 关心 模式 ) 为 


single :: [a] -> Bool 
single [_] = True 
single _ = False 


现在 可 以 定义 : 


expand1 :: Matrix [Digit] -> [Matrix [Digit]] 

expandl1 rows 

= [rowsl ++ [rowl ++ [c] :row2] ++ rows2 | c¢ <- cs] 
where 
(rowsl,row:rows2) = break (any (not . single)) rows 
(rowl ,cs:row2) = break (not . single) row 


第 一 个 where 子 句 将 矩阵 拆 分 成 两 个 行 的 列表 ， 第 二 个 列表 的 第 一 个 元 系 是 包含 非 单 选 
择 列表 的 行 ， 第 二 个 break 再 将 该 行 拆 分 成 两 个 列表 ， 其 中 第 二 个 列表 的 第 一 个 元 素 是 
第 一 个 非 单 选择 元 每 。 如 末 和 矩阵 只 包含 单 选择 元 系 ， 则 


break (any (not . single)) rows = [rows,[]] 


而 且 expandl 的 运行 返回 一 个 错误 信息 。 

函数 expandl 的 定义 的 问题 是 它 可 能 引起 无 用 的 工作 。 如 果 这 样 找到 的 第 一 个 非 单 
选择 元 素 恰 好 是 空 列 表 ， 那 么 expand1 将 会 返回 空 列表 ， 但 是 ， 假 如 这 个 列表 在 矩阵 中 
藏 得 很 深 ， 那么 expand1 将 会 做 许多 无 意义 的 计算 ， 企 图 找到 一 个 根本 不 存在 的 解 。 合 
理 的 、 更 好 的 选择 扩展 格子 的 方法 是 找 出 具有 有 最少 选 择 ( 当然 不 是 1) 的 格子 。 一 个 没有 
选择 的 格子 意味 看 这 个 迹 题 不 可 解 ， 所以， 尽快 找 出 这 些 格子 是 一 个 好 想法 。 在 expandl 
中 实现 这 个 想法 的 定义 如 下 : 
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expandl :: Matrix [Digit] -> [Matrix [Digit]] 
expandi1 rows 
= [rowsl ++ [rowl ++ [c] :row2] ++ rows2 | c¢ <- cs] 
where 
(rowsi,row:rows2) = break (any smallest) rows 
(rowl,cs:row2) = break smallest row 
smallest cs = length cs == n 
n = minimum (counts rows) 


了 疯 数 counts 定义 为 


counts = filter (/= 1) . map length . concat 


值 n 是 选择 矩阵 中 不 等 于 1 的 最 小 选择 数 。 函 数 minimum 的 定义 将 留 作 练习 3。 如 宁 
矩阵 中 包含 任何 选择 为 空 的 元 素 ， 那 么 n 将 会 是 0， 此 时 expand1 将 返回 一 个 空 列表 。 
另 一 方面 ， 如 果 和 矩阵 只 含 单 个 选择 元 素 ， 那 么 将 是 空 列表 的 最 小 值 ， 这 是 无 定义 值 1， 
此 时 expandl 也 将 返回 上 ， 所 以 最 好 确保 expand1l 被 应 用 于 非 完 全 矩阵。 如 果 一 个 矩 
阵 不 满足 complete， 则 是 非 完 全 的 : 


complete :: Matrix [Digit] -> Bool 
complete = all (all single) 


也 可 以 将 valia 推广 到 选择 和 矩阵 上 的 测试 。 假 定 如 下 定义 safe: 


safe :: Matrix [Digit] -> Bool 

safe m = all ok (rows m) && 
all ok (cols m) && 
all ok (boxs m) 

ok row = nodups [x | [x] <- row] 

如 果 一 个 矩阵 的 任何 行 、 列 和 块 中 的 单 选择 都 不 重复 ， 则 称 和 矩阵 是 安全 的 (safe)。 
但 是 ， 一 个 矩阵 可 能 包含 非 单 选择 列表 元 素 。 裁 剪 可 以 使 得 安全 矩阵 变 为 不 安全 矩阵， 但 
是 如 果 一 个 矩阵 裁剪 后 是 安全 的 ， 那 么 裁剪 前 一 定 是 安全 的 ， 用 公式 表示 为 safe . 
prune = safe。 一 个 完全 而 且 安 全 的 矩阵 便 是 数 独 迹 题 的 一 个 解 ， 而 且 这 个 解 可 以 用 简 
化 的 expana 抽取 : 


extract :: Matrix [Digit] -> Grid 
extract = map (map head) 


因此 ， 在 安全 与 完全 的 矩阵 m 上 有 


filter Valid (expand m) = [extract m] 


在 安全 但 不 完全 的 矩阵 上 有 


filter Valid . expand 
= filter Valid . concat . map expand . expandl 


在 两 边 进行 置换 的 情况 下 等 号 成 立 。 因 为 
filter P . concat = concat . map (filter p) 


因此 filter valid . expand 化 简 为 


concat . map (filter p . expand) . expandl 


现在 可 以 插入 一 个 裁剪 ， 得 到 
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concat . map (filter p . expand . prune) . expandl 


因此 ， 引 入 下 列 函 数 : 


search = filter valid . expand . prune 


在 安全 但 不 完全 的 矩阵 上 有 


search = concat . map search . expandl . prune 


现在 可 以 用 下 面 的 第 三 个 版 本 代替 solve: 


solve = Search . choices 
search cm 
| not (safe pm) = 站 
| complete pm = [extract pm] 
| otherwise = concat (map search (expandi pm)) 
where pm = prune cm 


这 是 最 终 的 数 独 简单 求解 器 。 可 以 在 最 后 一 行将 prune 用 many prune 代替 ， 有 时 多 次 


裁 双 比 一 次 裁剪 快 ， 有 时 则 不 然 。 注 意 到 第 一 次 安全 检查 是 紧 跟 在 扩展 选择 的 一 轮 裁 前 
后 ， 因 此 有 问题 的 输入 会 很 快 被 发 现 。 


5.5 习题 
习题 A 如 何在 整数 矩阵 上 给 每 个 元 素 加 1? 如 何 求 一 个 矩阵 所 有 元 素 之 和 ? 函数 
zipWith ( +) 将 两 行 相 加 ， 那 么 什么 函数 可 以 将 两 个 矩阵 相 加 ? 如 何 定义 矩阵 乘积 ? 
习题 B 请 问 和 矩阵 [[] ,，[] ] 的 维 数 是 什么 ? 和 矩阵 [] 呢 ? 
函数 cols (这 里 重 命名 为 transpose) 的 定义 是 
transpose :: [[a]] -> [[a]] 


transpose [xs] = [[x] | x <- xs] 
transpose (xs:xss) = ZipWith (:) xs (transpose xss) 


请 填写 下 面 的 省 略 部 分 ， 然 后 可 用 它 作为 上 面 定义 的 第 一 个 子 句 。 
transpose [] Bo 
以 上 定义 的 transpose 按 行进 行 。 下 面 是 按 列 进行 转 置 的 部 分 定义 : 


transpose xss = map head xss:transpose (map tail xss) 


请 完成 该 定义 。 
习题 C 下列 哪 些 等 式 成 立 (不 必 证 明 ): 


any P = not . all (not p) 
any null = null . cp 


习题 D ”给 定 一 个 列表 排序 函数 sort :: (Ord a) => [al -> [a] ,请 给 出 下 列 
函数 的 定义 。 

nodups :: (0rd a) => [a] -> Bool 

习题 E 函数 nub :: (Eq a) => [a] -> [a] 删 除 列表 中 的 重复 元 素 (该 函数 的 一 
个 版 本 见 模块 Data .List)。 请 给 出 nub 的 定义 。 假 定 结果 中 元 素 的 次 序 不 重要 ,请 
定义 : 


一 个 简单 的 数 独 解 器 | 


nub :: (0rd a) => [a] -> [al 


使 得 该 函数 更 高 效 。 
习题 F 函数 takewhile 和 dropwhile 满足 下 列 等 式 : 


span p xs = (takeWhile p xs,dropWhile p xs) 


请 使 用 直接 递归 定义 takewhile 和 dropWwhile。 

假定 whiteSpace :: Char -> Bool 测试 一 个 字符 是 空白 (如 空格 、tab 键 和 换行 
符 ) 还 是 可 见 字 符 ， 请 给 出 下 列 函 数 的 定义 。 

words :: String -> [Word] 

该 函数 将 一 个 串 拆 分 成 词 的 列表 。 

习题 G 请 定义 minimum :: Orda => [a] -> ae 

习题 H 为 什么 没有 如 下 定义 solve? 


solve = search . choices 
search m 


| not (safe m) = 吕 
| complete m = [extract m] 
| otherwise = process m 


where process = concat . map search . expandil . prune 


5.6 答案 


习题 A 答案 ”给 和 矩阵 每 个 元 素 加 1 可 定义 为 map (map (+1))。 

对 和 矩阵 元 素 求 和 可 以 用 sum . map sum 实现 ， 其 中 sum 对 数 的 列表 求 和 。 男 一 种 方 
法 是 用 sum . concat。 

矩阵 相 加 定义 为 zipWith (zipWith (+))。 

对 于 和 矩阵 乘积 ， 可 以 先 定义 : 

scalarMult :: Num a => [a] -> [a] -> a 

scalarMult xs ys = sum (Zipwith (*) xs ys) 


然后 定义 : 


matMult :: Num a => Matrix a -> Matrix a -> Matrix a 
matMult ma mb = [map (scalarMult row) mbt | row <- mal] 
where mbt = transpose mb 


习题 B 答案 ”和 窍 阵 [[]，,[] 1] 的 维 数 是 2 x0。 和 矩阵 [] 的 维 数 是 0 xn,n 是 任意 整数 。 
这 种 矩阵 的 转 置 必须 具有 维 数 n x0，n 是 任意 整数 。 唯 一 的 可 能 是 令 n 为 无 穷 大 : 


transpose :: [[a]] -> [[a]] 
transpose [] = repeat [] 
transpose (xs:xss) = ZipWith (:) xs (transpose xss) 


其 中 repeat x 返回 x 的 无 穷 次 重复 列表 。 注 意 到 


transpose [xs] = zipWith (:) xs (repeat []) 
= [[x] | x <- xs] 


为 一 种 定义 是 
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transpose ([]:xss) = [] 
transpose xss = map head xss:transpose (map tail xss) 


第 一 行 的 假设 是 ， 如 宁 第 一 行 是 空 的 ， 那 么 所 有 行 是 空 的 ， 因 此 转 置 是 空 矩 阵 。 
习题 C 答案 ”两 个 等 式 均 成 立 。 
习题 D 答案 


nodups :: (0rd a) => [a] -> Bool 
nodups xs = and (zipWith (/=) ys (tail ys)) 
where ys = sort xs 


习题 E 答案 
nub :: (Eq a) => [a] -> [a] 
nub [] = [| 


nub (x:xs) = x:nub (filter (/= x) xs) 


nub :: (0rd a) => [a] -> [a] 
nub = remdups . sort 


remdups [|] = [] 
remdups (x:xs) = x:remdups (dropWhile (==x) xs) 


晒 数 dropWwhile 在 习题 中 定义 。 
习题 F 答案 


takeWhile, dropWhile :: (a -> Bool) -> [a] -> [a] 
takeWhile p [] = [0] 
takeWhile p (x:xs) 

= if p x then x:takeWhile p xs else [] 
dropWhile p [] = 0D 
dropWhile p (x:xs) 

= if p x then dropWhile p xs else x:xs 


孙 数 words 的 定义 是 


words :: String -> [Word] 
words xs | null ys = [] 
| otherwise = Ww:words Zs 
where ys = dropWhile whiteSpace xs 
(w,ZS) = break whiteSpace ys 


习题 G 答案 


minimum :: Ord a => [a] -> a 
minimum [x] = XxX 
minimum (x:xs) = x ‘min minimum xs 


注意 空 列表 的 最 小 值 无 定义 。 
习题 H 答案 ”如果 一 次 裁剪 后 矩阵 是 完全 的 ， 那 么 solve 的 这 个 定义 将 返回 无 定义 值 。 


5.7 注 记 


《 卫 报 》 不 再 使 用 本 章 开 端 关于 数 独 的 说 明 。 本 章 内 容 来 自我 的 《Pearls of Functional 
Algorithm Design》 (Cambridge，2010) 。 以 下 网 页 包含 大 约 20 个 数 独 的 Haskell 实现 ; 
haskell. org/ haskellwiki/ Sudoku 


许多 实现 使 用 数组 或 者 单子 。 我 们 将 在 第 10 章 讨论 数组 和 单子 。 
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Thinking Functionally with Haskell 


证 明 





我 们 已 经 在 前 两 章 看 到 许多 定律 ， 尽 管 “ 定 律 ”这 个 词 有 扩 不 恰当 ， 因 为 它 意味 痢 它 
们 是 从 天 上 来 的 ， 无 需 证 明 。 不 过 至 少 简短 是 这 个 词 的 优点 。 目 前 遇 到 的 定律 均 断 言 两 个 
函数 表达 式 的 相等 〈 可 能 在 某 些 附加 条 件 下 ) ， 换 句 话 说， 定律 的 形式 是 函数 之 间 的 等 式 
或 者 恒等式 〈identity) ， 并 且 计 算是 点 自由 式 的 计算 (关于 点 自由 式 计算 参见 第 4 章 及 其 
习题 K 的 答案 ) 。 给 定 适 当 的 定律 ， 可 以 利用 等 式 推理 证 明 其 他 定律 。 等 式 逻辑 是 函数 式 
程序 设计 中 简单 且 有 效 的 工具 ， 因 为 它 能 引导 人 们 找到 已 构造 的 函数 或 者 值 的 新 的 而 且 更 
有 效 的 定义 。 效 率 是 第 7 章 的 主题 。 本 章 是 关于 等 式 推理 的 另 一 方面 ， 即 归纳 证 明 。 本 章 
还 将 引入 能 够 描述 计算 的 共同 特征 的 高 阶 (higher order) 函数 ,说 明 如 何 用 高 阶 函数 简化 
证 明 。 可 以 证 明 这 些 高 阶 函 数 的 一 般 性 质 ， 然 后 将 其 应 用 于 其 他 函数 ， 而 不 必 对 相似 的 孙 
数 性 质 一 次 次 重复 证 明 。 


6. 1 自然 数 上 的 归纳 法 


考虑 下 面 的 舌 函 数 定义 : 

exp :: Num a => a -> Nat -> a 

exp X Zero = 1 

exp X (Succ n) = x * exp xn 
以 前 的 定义 可 能 是 

exp :: Num a => a -> Int -> a 

exp X 0 = 1 


eXP X (n+1) = x * exp X 了 


但 是 目前 Haskell 的 标准 版 本 Haskell 2010 中 不 再 允许 使 用 这 种 (n+1) 模式 的 定义 。 
无 论 如 何 定义 ， 下 列 等 式 对 任意 m 和 nn 都 应 该 成 立 。 


exp xX (m+n) = exp Xm* expxn 


因为 数学 等 式 x"*" = x"x” 是 成 立 的 。 但 是 如 何 证 明 这 个 定律 呢 ? 答案 当然 是 归纳 法 
(induction) 。 每 个 自然 数 或 者 是 Zero 或 者 形 如 succ mn， 其 中 对 是 某 个 自然 数 。 这 也 正 
是 数据 类 型 Nat 的 定义 描述 的 : 


data Nat = Zero | Succ Nat 


所 以 ， 要 证 明 P(n) 对 于 任意 目 然 数 成 立 ， 只 要 证 明 : 

1. P(0) 成 立 ; 

2. 对 于 任意 自然 数 n， 假定 P(n) 成 立 ， 则 P(n+1) 成 立 。 

这 里 已 经 恢复 使 用 0 表示 Zero,，n +1 表示 Succ n, 今后 也 将 沿用 这 种 记 法 。 在 第 
二 个 证 明 中 ， 可 以 假定 P(n) 成 立 ， 并 在 证 明 P(n+1) 时 使 用 该 假设 。 

作为 例子 ， 证 明 对 于 所 有 x、m 和 nn 下 列 等 式 成 立 。 
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exp X (mtn) = exp x m* expxn 


现在 是 对 m 归纳 ， 也 可 以 对 归纳 ,但 是 证 明 会 更 复杂 。 以 下 是 证 明 。 
0 的 情况 


exp X (0 + n) exp xXx0* expxun 
= {因为 0+n=n} = {exp.1} 
exp X n 1* expxn 

= {因为 1 * x = x} 

exp X 1n 
m+1 的 情况 
exp x ((m + 1) + n) exp XxX (mt+1) * exp x n 
- {算术 运算 } - (em 
exp x ((m + n) + 1)) (XxX * exp XxX m) * exp Xn 
= {exp.2} = {因为 * 满足 结合 律 } 
XxX* exp X (m+ n) X* (exp xX m* exp xX n) 
= {归纳 假设 } 


xX* (exp Xx mu* exp X n) 


以 上 证 明 格 式 将 会 用 于 归纳 证 明 。 证 明 分 两 种 情况 : 基本 情况 (base case) 0 和 归纳 
情况 (induction case) n+ 1。 每 种 情况 分 两 列 ， 一列 对 应 等 式 左 边 ， 男 一 列 对 应 等 式 右 
边 。( 知 两 列 太 宽 写 不 下 时 ， 则 一 列 接 一 列 写 。) 化 简 等 式 每 边 表达 式 ， 直 至 两 边 化 简 到 同 
一 个 表达 式 ， 即 可 完成 证 明 的 每 种 情况 。 括 号 中 的 理由 exp .1 和 exp .2 表示 exp 定义 
中 的 第 一 个 和 第 二 个 等 式 。 

最 后 ， 注 意 到 证 明 应 用 了 3 个 定律 ， 即 


(m+1)+n= (m+n)+1 
1 末世 = 以 
(XxX * y)*Z=X* (y* 2Z) 


如 果 从 零 开 始 重建 算术 一 一 非常 元 长 的 过 程 ， 那 么 这 些 定律 也 需要 证 明 。 事 实 上 ， 只 有 第 
一 个 定律 可 以 证 明 ， 因 为 它 只 涉及 目 然 数 ， 而 且 已 定义 了 加 法 运算 。 后 两 个 定律 依赖 于 
Haskell 中 类 族 Num 的 各 种 实例 中 乘法 的 实现 。 

实际 上 ， 绪 合 律 最 终 转换 为 浮 点 数 的 结合 律 : 


ghci> (9.9el0 * 0.5e-10) * 0.1e-10 :: Float 
4.95e-11 

ghci> 9.9el0 * (0.5e-10 * 0.1e-10) :: Float 
4.9499998e-11 


回顾 科学 记 法 的 9 .9e1l0 表示 9.9 x10”"。 所 以 ,尽管 证 明 在 数学 上 正确 ,但 是 其 中 
的 一 个 等 式 至 少 在 Haskell 中 是 不 正确 的 。 


6.2 列表 归纳 法 


每 个 有 穷 列表 或 者 是 空 列表 [] ， 或 者 形 如 x:xs， 其 中 xs 是 一 个 有 穷 列表 。 所 以 ， 
要 证 明 P(xs) 对 于 所 有 有 穷 列表 xs 成 立 ， 需 要 证 明 . 

1; P([]) 成立， 

2. 对 于 任意 x 和 任意 有 穷 列表 xs ,假设 P(xs) 成 立 ， 则 P(x:xs) 成 立 。 


证 有 明 /> 


作为 例子 ， 回 顾 串 联 ( ++ ) 的 定义 : 


[] ++ ys = yS 
(XxX:x8) ++ ys = XxX : (xs ++ ys) 


现在 证 明 ++ 满 足 分 配 律 ， 即 对 于 所 有 有 穷 列 表 xs， 所 有 列表 ys 和 zs (注意 不 要 
求 后 两 个 列表 是 有 穷 的 ) ， 下 列 等 式 成 立 。 


(xs ++ ys) ++ Zs = Xs ++ (ys ++ ZS) 


证 明 对 xs 使 用 归纳 法 : 
[] 的 情况 

([] ++ ys) ++ zs [] ++ (ys ++ zs) 
= {+.1} = {++.1) 

ys ++ ZS ys ++ 2Z8 
x:xs 的 情况 

((x:XS) ++ ys) ++ Zs (x:XS) ++ (ys ++ ZS) 
= {++.2} = {++.2} 

(x: (xs ++ ys)) ++ zs X:(X8 ++ (ys ++ 28)) 
=- {++.2} = {归纳 假设 } 

Xx:((xs ++ ys) ++ ZS) X:((xs ++ ys) ++ zs) 
再 看 一 个 例子 。 给 定 下 列 定义 : 
reverse [] = [] 


reverse (x:xs) = reverse xs ++ [x] 


证 明 reverse 是 一 个 对 合 ， 即 对 于 所 有 有 穷 列表 xs 下 列 等 式 成 立 。 


reverse (reverse xXxs) = XS 


递归 的 基本 情况 简单 ， 容 易 验 证 。 归 纳 情况 证 明 如 下 : 
x:xs 的 情况 
reverse (reverse (x:xs)) 
= {reverse.2} 
reverse (reverse xs ++ [x]) 
= 1{?222??} 
x:reverse (reverse xs) 


= {归纳 假设 } 


X:XS 


等 式 右边 的 化 简 省 略 了 ， 因 为 它 本 身 就 是 x:xs。 但 是 上 面 的 证 明 过 程 中 间 被 卡 住 了 。 
这 里 需要 一 个 辅助 结果 ， 即 对 于 任意 有 穷 列 表 ys 下 列 等 式 成 立 。 


reverse (ys ++ [x]) = x:reverse ys 


这 个 辅助 命题 也 可 以 用 归纳 法 证 明 : 


[] 的 情况 
reverse ([] ++ [x]) x:reverse [] 
= {++.1} = {reverse.1} 
reverse [x] [x] 


= {reverse.2} 
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reverse [] ++ [x] 


= {reverse.1 and++.1} 


[x] 
y:ys 的 情况 
reverse ((y:ys) ++ [x]) x:reverse (y:ys) 
= {++.2} = {reverse.2} 
reverse (y:(ys ++ [x])) x: (reverse ys ++ [y]) 


= {reverse.2} 

reverse (ys ++ [x]) ++ [y] 
= {归纳 假设 } 

(x:reverse ys) ++ [y] 
-fr 


x: (reverse ys ++ [y]) 


这 就 证 明了 辅助 命题 成 立 ， 所 以 主 命题 成 立 。 


非 完 整 列表 上 的 归纳 


非 完整 列 表 或 者 是 无 定义 列表 ， 或 者 形 如 x:xs， 其 中 xs 是 非 完 整 列表 。 因 此 ， 要 
证 明 P(xs) 对 于 所 有 非 完 整 列表 成 立 ,需要 证 明 : 

1. P(undefined) 成 立 ; 

2. 对 于 任意 x 和 任意 非 完 整 列表 xs ,假定 P(xs) 成 立 , 则 P(x:xs) 成 立 。 

作为 例子 ， 下 面 证 明 对 于 任意 非 完 整 列表 xs 和 任意 列表 ys 下 列 等 式 成 立 。 


XS ++ ys = XS 


undefined 的 情况 
undefined ++ ys 
= {++.0} 
undefined 
x:xs 的 情况 
(X:XS) ++ ys 
= {++.2} 
x: (XS ++ yYS) 
= {归纳 假设 } 
每 种 情况 中 省 略 了 等 式 右 边 的 平凡 化 简 。 理 由 ( ++ .0) 表示 (++) 定义 中 失败 的 
子 句 ， 因 为 串联 是 对 左边 参数 模式 匹配 定义 的 ， 如 果 该 参数 无 定义 ， 则 结果 也 无 定义 。 


无 穷 列表 上 的 归纳 


证 明 无 穷 列 表 的 某 个 性 质 需 要 今后 几 章 的 内 容 做 基础 。 无 穷 列表 基本 上 可 以 理解 为 一 
个 非 完整 列表 序列 的 极限 。 例 如 ，[0 . .] 是 下 面 序列 的 极限 。 


undefined， 0:undefined， 0:1:undefined， 0:1:2:undefined， 


如 果 一 个 性 质 PP 满足 ， 对 于 任意 以 xs 为 极限 的 序列 xso，xs1，…， 当 P(xs,) 成 立 
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(对 于 所 有 n) 时 P(xs) 也 成 立 ， 则 称 性 质 已 为 链 完 全 的 〈chain complete)。 

换 句 话说 ， 如 果 P 是 链 完全 的 性 质 ， 而 且 对 于 所 有 非 完 整 列表 (也 可 能 包含 所 有 有 穷 
列表 ) 成 立 ， 则 性 质 P 对 所 有 无 穷 列表 成 立 。 

许多 性 质 是 链 完 全 的 ， 例 如 : 

e。 所 有 等 式 el =e2 是 链 完 全 的 ， 其 中 el 和 e2 是 包含 受 全 称 量词 约束 自由 变量 的 

Haskell 表达 式 ; 

e。 如 果 P 和 0Q 都 是 链 完全 的 ， 那 么 它们 的 合 取 已 AQ 是 链 完 全 的 。 

但 是 ， 不 等 式 el 关 e2 不 一 定 是 链 完 全 的 ， 同 样 存在 量词 表示 的 性 质 也 不 一 定 是 链 完 
全 的 。 例 如 ， 考 虑 断言 : 存在 某 个 整数 使 得 


drop n xs = undefined 
这 个 性 质 对 于 所 有 的 非 完整 列 表 显 然 是 成 立 的 ， 对 于 无 穷 列表 显然 不 成 立 。 


下 面 是 一 个 证 明 的 例子 。 前 面 曾 证 明了 对 于 所 有 的 有 穷 列表 xs 和 所 有 列表 ys 和 
ZS, 下 列 等 式 成 立 。 


(x8 ++ ys) ++ Zs = XS ++ (ys ++ ZS) 


可 以 证 明 ， 这 个 链 完 全 的 性 质 可 以 推广 到 所 有 的 列表 xs。 
undefined 的 情况 


(undefined ++ ys) ++ zs undefined ++ (ys ++ ZS) 
= {++.0) = {++.0} 

undefined ++ Zs undefined 

= {0} 

undefined 


所 以 ，++ 是 列表 上 真正 的 可 结合 运算 ， 不 论 列表 是 有 穷 的 、 非 完整 的 还 是 无 穷 的 。 
不 过 推广 性 质 要 格外 小 心 。 前 面 曾经 证 明了 对 于 所 有 有 穷 列 表 有 


reverse (reverse XS) = XS 


通过 证 明 下 面 的 额外 情况 ， 能 否 将 等 式 推广 到 所 有 列表 ? 
undefined 的 情况 


reverse (reverse undefined) 
= {reverse.0} 
undefined 


这 种 情况 证 明 通过 ， 但 是 等 式 仍然 有 问题 ， 对 于 任意 非 完 整 列 表 xs ， 得 到 Haskell 
等 式 : 


reverse (reverse xs) = undefined 


是 哪里 出 了 问题 ? 答案 是 ,证 明 reverse 的 对 合 性 用 到 了 对 于 任意 有 穷 列表 ys 的 下 列 
辅助 结果 : 


reverse (ys ++ [x]) = x:reverse ys 


这 个 等 式 并 不 是 对 所 有 列表 成 立 ， 而 且 对 于 非 完整 列表 vs 确实 不 成 立 。 
由 此 得 出 reverse 不 是 列表 上 的 恒 等 函 数 。 列 表 上 的 函数 等 式 £ = g 表示 对 于 所 有 


78 第 6 章 


列表 xs ， 即 有 穷 、 非 完整 和 无 穷 列表 ， 等 式 E xs = g xs 都 成 立 。 如 果 等 式 仅 对 有 穷 列 
表 成 立 ， 则 必须 明确 说 明 。 


6.3 函数 foldr 
下 面 的 函数 都 有 一 个 共同 的 模式 : 


sum [] = 0 
sum (X:XS) = X + SUm Xs 


concat [] = 口 
concat (xs:xss) = XS ++ concat xss 


filter p [] = [] 
filter p (x:xs) = if p x then x:filter p xs 
else filter XS 
Pp 


map £f [] = [] 
map f (x:xs) = f x:map f xs 


类 似 地 ， 下 列 定 律 的 归纳 证 明 都 有 一 个 共同 的 模式 : 


sunm (xs ++ ys) = sum XS + sum ys 

concat (xss ++ yss) = concat xss ++ concat yss 
filter p (xs ++ ys) = filter p xs ++ filter p ys 
map f (xs ++ yS) = map f xs ++ map f ys 


难道 不 能 将 以 上 函数 定义 为 一 个 更 通用 函数 的 特例 ， 同 样 将 以 上 定律 定义 为 一 个 通用 
定律 的 特例 ?这 样 将 会 节省 大 量 的 重复 劳动 。 
图 数 fo1dr (从 右边 折 闭 ) 定义 如 下 : 


foldr :: (a -> b -> b) ->b -> [a] ->b 
foldr f e@ [] = 6 
foldr f e (x:xs) = f x (foldr f e xs) 


为 理解 定义 ， 考 虑 下 例 : 
foldr (@) e [x,y,z] =xQ@ (ygQ® (z ©@ e)) 
Bey m2 {yy Cw 2 
换 句 话说 ，foldr (@) e 应 用 于 一 个 列表 的 结果 是 将 空 列表 用 e 代替 , 将 (:) 用 (@) 代 
替 ， 然 后 对 表达 式 求 值 。 括 号 是 右 结合 的 ， 如 函数 名 所 指 。 
由 此 即 得 ，foldar (:) [] 是 列表 上 的 恒 等 函 数 。 更 多 的 结果 如 下 : 


sum = foldr (+) 0 

concat = foldr (++) [] 

filter p = foldr (\x xs -> if p x then x:xs else xs) [] 
map f = £0ldr (CGC:) »。 EY 日 


下 列 事实 抓 住 了 前 面 提 到 的 各 种 等 式 : 


foldr f e (xs ++ ys) = foldr f e xs @ foldr f e ys 


其 中 (@ ) 是 某 个 满足 不 同性 质 的 运算 。 下 面 对 xs 进行 归纳 证 明 该 等 式 。 在 证 明 过 程 中 可 
以 发 现 f、e 和 (e ) 需要 满足 的 性 质 。 
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[] 的 情况 
foldr f @ ([] ++ ys) foldr f @ [] @ foldr f e ys 
= {++.1} = {foldr.1} 
foldr f e ys e @ foldr f e ys 
所 以 ,需要 的 条 件 是 ， 对 于 任意 x， 等 式 e 8@ x = Xx 成立。 
x:xs 的 情况 
foldr f @ ((x:xs) ++ ys) 
= {++.2} 
foldr f e (x:(xs ++ ys) 
= {foldr.2} 
f x (foldr f e (xs ++ ys)) 
= {归纳 假设 } 
f x (foldr f exs @ foldr f @ ys) 
这 种 情况 的 右边 简化 为 


f x (foldr f e@ xs) @ foldr f e ys 


所 以 ， 总 的 来 说 ， 需 要 下 列 等 式 : 


e @ 工 = XX 
fxl(lyQ0z)=fxyQ0z 


对 于 任意 x、y 和 z 成 立 。 特 别 是 ， 如 果 f = (@) 并 且 (@) 是 与 单位 元 e 结合 的 ， 那么 以 
上 要 求 即 可 满足 。 由 此 即 可 证 明 : 


sum (XS ++ ys) = sum XS + sum ys8 
concat (xss ++ yss) = concat xss ++ concat yss 


对 于 map 的 定律 ， 需 要 下 面 等 式 : 


[] ++ xs = XS 
f x:(xs ++ ys) = (f x:xs) ++ ys 


这 两 个 等 式 可 以 根据 串联 定义 立即 证 明 。 
对 于 filter 的 定律 需要 满足 


if p x then x:(ys ++ ZS) else ys ++ Zs 
= (if p x then x:ys else ys) ++ zs 


根据 串联 和 条 件 表达 式 定 义 ， 以 上 等 式 也 成 立 。 
融合 
图 数 foldr 最 重要 的 性 质 是 融合 定律 (fusion law ) : 


f . foldr ga= foldr hb 


只 要 其 中 的 元 素 满 足 一 定 的 性 质 。 下 面 是 两 个 简单 的 例子 : 


double . sum = foldr ((+) . double) 0 
length . concat = foldr ((+) . length) 0 


实际 上 ,已 看 到 的 许多 定律 是 foldr 融合 律 的 特例 。 总 之 ， 融 合 律 是 列表 上 归纳 法 
的 预制 包 。 
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至 于 融合 律 中 需要 什么 条 件 ， 可 以 在 融合 律 的 归纳 证 明 过 程 中 发 现 。 融 合 律 是 一 个 上 
数 等 式 ， 所 以 需要 证 明 等 式 对 于 所 有 有 穷 列表 和 非 完整 列表 成 立 。 
undefine 的 情况 


f (foldr g a undefined) foldr h b undefined 
= {foldr.0} = {foldr.0} 
f undefined undefined 
所 以 ， 第 一 个 条 件 是 ，f 必须 是 严格 的 。 
[] 的 情况 
f (foldr g a []) foldr hb [0] 
= {foldr.1} = {foldr.1} 
fa b 
第 二 个 条 件 是 fa = b。 
x:xs 的 情况 
f (foldr g a (x:xs)) foldr h b (x:xs) 
= {foldr.2} = {foldr.2} 
f (gx (foldr g a xs)) h x (foldr h b xs) 
= {归纳 假设 } 


h x (f (foldr g a xs)) 


第 三 个 条 件 是 E (g xy) = h x (fy) 对 任意 x 和 y 成 立 。 
现在 利用 融合 律 来 证 明 下 列 等 式 : 


foldr f a . map g = foldr h a 


注意 到 map f = foldr ((:) . g)。 检 查 融 合 律 的 条 件 ， 有 下 列 等 式 : 


foldr f a undefined = undefined 
foldr fa [] = a 


所 以 ,前 两 个 融合 条 件 满足 。 第 三 个 条 件 是 


foldr f a (g x:xs) = h x (foldr f a xs) 


左边 化 简 为 


f (g x) (foldr f a xs) 


所 以 , 定义 hxy = 上 (g x) y， 更 简洁 的 表示 是 h = £ . g。 因此， 得 到 有 用 的 规则 : 


foldr f a . map g = foldr (f . g) a 


特别 是 
double . sum = sum . map double 
= foldr ((+) . double) 0 


length . concat = sum . map length 
= foldr ((+) . length) 0 


融合 律 的 其 他 简单 结论 将 在 习题 中 讨论 。 
一 种 变形 


有 时 候 处 理 列表 是 很 头疼 的 事 。 例 如 ， 空 列表 的 最 小 元 素 是 什么 ”为 此 ，Haskell 提 
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供 了 foldr 的 另 一 种 形式 ， 称 为 foldr1, 该 函数 仅 定义 在 非 空 列表 上 。 函 数 foldr1 
的 Haskell 定义 如 下 : 


foldrl :: (a -> a -> a) -> [a] -> a 
foldri f [x] = Xx 


foldri f (x:xs) = f x (foldri f xs) 
因此 ， 可 以 定义 : 
minimum, maximum :: Ord a => [a] -> a 


minimum = foldri min 
maximum = foldri1 max 


而 且 避 免 了 两 个 显 式 递归 。 事 实 上 ， 这 里 folar1 的 定义 不 是 它 的 最 通用 定义 ， 这 个 问题 
留 在 习题 中 讨论 。 


6.4 水 数 fo01d1l 
回顾 等 式 


foldr (@) e [w,x,y,z] =wQ@ (xQ@ (yg®@ (z @ e))) 


有 时 候 对 右边 更 方便 的 模式 是 


(((eGwjex)ey)e@z 


这 种 计算 模式 由 函数 £01d1 〈 从 左边 折 释 ) 概括 如 下 : 


foldl :: (b -> a -> b) ->b -> [aj -> 
foldl fe [] = 6 
foldl f e (x:xs) = foldl  (f e x) xs 


例如 ， 假 定 已 知 一 个 串 ， 如 表示 一 个 实数 1234. 567 的 串 ， 需 要 求 出 它 的 整数 部 分 和 
小 数 部 分 。 可 以 定义 : 


ipart :: String -> Integer 
ipart xs = read (takeWhile (/= '.') xs) :: Integer 


fpart :: String -> Float 
fpart xs = read ('0':dropWhile (/= '.' xs) :: Float 


其 中 使 用 了 类 族 Read 的 方法 read。 顺 便 指出 ，. 567 不 是 Haskell 的 合式 文字 。 为 了 避免 
与 图 数 复合 运算 符 混淆 ， 在 小 数 点 前 后 都 至 少 应 该 有 一 个 数字 。 例 如 : 


ghci> :t 3 . 4 
3.4:: (Nm (b -> c), Num (a -> b)) => a -> C 


为 外 一 种 定义 是 


parts :: String -> (Integer,Float) 
parts ds = (ipart es,fpart fs) 
where (es,d:fs) = break (== '.') ds 
ipart = foldl Shiftl 0 . map toDigit 
Where Shiftl nd = n*10 + d 
fpart = foldr shiftr 0 . map toDigit 
Where Shiftr dx = (d + x)/10 
toDigit d = fromIntegral (fromEnum d - fromEnum '0') 


因为 
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1234 =1 x 1000+2x100+3x10+4 
=(((0xl0+1) xl0+2) xl0+3)x10+14 
0.567 = $5/10 + 6/100 + 7/1000 
=(5$S+(6+(7+0)/10)/10)/10 
所 以 ,使 用 fo1d1 取得 整数 部 分 和 使 用 fo1ldr 得 到 小 数 部 分 都 得 到 了 展示 。 
再 如 ， 函 数 reverse 由 如 下 等 式 定 义 : 


reverse [] = [] 
reverse (X:XS) = reverse xs ++ [x] 


我 们 现在 学 到 了 更 聪明 的 方法 ， 可 以 定义 : 


reverse = foldr snoc 吕 
Where snoc x xs = XS ++ [x] 


但 是 ， 一知半解 是 危险 的 :reverse 的 两 个 定义 都 很 粳 ， 因 为 求 长 度 为 n 的 列表 的 
道 均 需 要 n 步 。 更 好 的 定义 是 


reverse = foldl (flip (:)) [] 


其 中 flip f xy = fy x。 现 在 列表 求 逆 的 新 定义 是 线性 的 : 
foldl (flip (:)) 0 [1i,2,3] 
= foldl (flip (:)) (1:[]) [2,3] 
= foldl (flip (:)) (2:1:[]) [3] 
s 2010L (fF1ip. (:)) (3:2517[1) 曲 
= 3:2:1:;[] 
计算 过 程 似乎 有 点 复杂 ， 但 是 这 个 新 定义 涉及 一 个 完整 的 工作 原理 ,将 在 第 7 章 介 绍 。 
如 本 例 所 示 ， 函 数 foldr 和 foldl 具有 下 列 关 系 ， 对 于 任意 有 穷 列表 xs 有 
foldl f e@ xs = foldr (flip f) e (reverse xs) 
foldr f e xs = foldl (flip f) e (reverse xs) 
证 明 留 作 习 题 。 注 意 对 有 穷 列表 的 限制 ， 当 xs 为 上 时 ， 等 式 两 边 均 为 上 。 这 也 表明 ,证 
明 必 须 依赖 于 一 个 只 对 有 穷 列表 成 立 的 辅助 性 质 。 
下 面 是 函数 folar 和 foldl 的 另 一 种 关系 : 对 任意 有 穷 列表 xs ， 如 果 


(<c>y)eooz=x<c>(7ye@z) 
eQ@rx =X <> 6 


则 有 
foldl (@) e xs = foldr (<>) @ XS 
证 明 留 作 习 题 。 作 为 这 个 定律 的 应 用 演示 , 假定 (< >) = (e)， 而 且 (@) 与 单位 元 e 可 


结合 。 那 么 两 个 条 件 都 成 立 ， 所 以 可 以 断言 : 对 于 任意 有 穷 列表 ， 如 果 (@ ) 与 单位 元 e 可 
结合 ,那么 


foldr (©@) e xs = foldl (@) e xs 


特别 是 ， 对 于 任意 有 穷 列表 xss ， 下 列 等 式 成 立 : 


concat xss = foldr (++) [] xss = foldl (++) [] xss 


如 果 xss 是 无 穷 列表 ， 那 么 两 个 定义 是 不 同 的 : 
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ghci> foldl (++) [] [[i] | i <- [1..]] 
Interrupted. 

Bhei> oldr Ka 0 {LH | [Lo] 
[1,2,3,4,{Interrupted} 


对 于 第 一 个 表达 式 ，GHCi 陷 人 长 久 沉默 ， 计 算 被 “终止 程序 运行 ” 键 中 断 。 对 于 第 二 个 
表达 式 ，CHCi 开始 输出 一 个 无 穷 列 表 。 所 以 ， 使 用 foldr 的 定义 在 无 穷 列表 上 可 行 , 但 
是 另 一 个 不 可 行 。 但 是 ， 或 许 使 用 foeldl 定义 的 concat 在 所 有 列表 有 穷 时 效率 更 高 。 
为 了 回答 这 个 问题 ， 观 察 下 面 的 计算 : 


foldr (++) [] [xs,ys,us,vs] 

= xs ++ (ys ++ (us ++ (vs ++ []))) 
foldl (++) [] [xs,ys,us,vs] 

= (((([] ++ xs) ++ ys) ++ US) ++ vs) 


假设 以 上 计算 中 每 个 列表 的 长 度 都 是 nw， 那么 右边 的 第 一 个 表达 式 需 要 4n 步 完 成 所 有 


串联 ， 而 第 二 个 表达 式 需 要 0 +n+(n+n) + (n+n+n) =6n 步 才能 完成 所 有 串联 。 这 足 
以 说 明 问 题 ， 至 少 到 目前 为 止 。 


6.5 函数 scanl 
函数 scanl f e 将 folqdl f e 应 用 于 一 个 列表 的 每 个 前 级 。 例 如 : 


ghci> scanl (+) 0 [1..10] 
[0,1,3,6,10,15,21,28,36,45,55] 
该 表达 式 计 算 列表 前 10 个 正 整数 的 流动 和 (running sum): 


[0O, O+1, (0O+1)+2, ((0+1)+2)+3, (((0+1)+2)+3)+4, ...] 


果 数 scanl 的 说 明 是 
scanl :: (b -> a -> b) -> b -> [a] -> [b] 
scanl f e = map (foldl f e) . inits 


inits :: [a] -> [[a]] 
inits [] = [[]] 


inits (x:xs) = [] : map (x:) (inits xs) 
例如 : 
ghci> inits "barbara" 
["","b", "ba", "bar", "barb", "barba", "barbar", "barbara"] 
负数 inits 在 模块 Data .List 中 定义 。 
但 是 ， 在 长 度 为 n 的 列表 上 ，scanl f 的 这 个 定义 计算 f 的 次 数 是 
0O+l+2+… +n = n(n+1)/n 
能 给 出 更 好 的 定义 吗 ? 是 的 ， 通 过 某 种 归纳 证 明 可 以 找到 一 种 更 好 的 定义 ， 只 是 不 清楚 要 
证 明 的 是 什么 ! 
[] 的 情况 
scanl f e [] 
= 二 汪 并 
map (foldl f e) (inits []) 
= {inits.1} 
map (foldl f e) [[]] 


可 -vv vv vv vv vv vv vv vv 上 


= {map.1 和 map.2} 
[foldl f e []] 

= {foldl.1} 
[e] 


因此 , 已 经 证 明了 scanl fe [] = [el]。 

x:xs 的 情况 

scanl f e (x:xs) 

二 定义} 

map (foldl f e) (inits (x:xs)) 

= {inits.2} 

map (foldl f e) ([]:map (x:) (inits xs)) 

= {map.1 和 map.2} 

foldl f e []:map (foldl f e . (x:)) (inits xs) 

= {foldl.1} 

e:map (foldl f @ . (x:)) (inits xs) 

= {要 求 :foldl f @ . (x:) = foldl f (f e x)} 

e:map (foldl f (f e x)) (inits xs) 

= {scanl 的 定义 } 

e:scanl f (f e x) xs 

证 明 中 要 求 的 条 件 是 £01d1 的 显然 结论 。 因 此 ， 总 结 起 来 ,已 经 证 明了 : 

scanl f @ [] = [e] 

scanl f e (x:xs) = e:scanl f (f e x) xs 
这 个 定义 只 需要 计算 线性 次 数 的 £。 

以 上 所 做 的 是 通过 程序 计算 (program calculation) 优化 函数 的 一 个 例子 。Haskell 令 人 
兴奋 的 一 氮 驶 是 完全 可 以 完成 这 样 的 任务 ， 而 不 必 另 外 引入 一 种 不 同 的 逻辑 语言 对 程序 
推理 。 

不 过 ， 引 导 库 中 scanl 的 定义 稍 有 不 同 : 


SCanl fe xs = @ : (case xs of 
[] -3 | 国 


X:XS -> SCanl f (f e x) xs) 


在 我 们 的 定义 中 scanl f e undefined = undefined， 而 对 于 引导 库 函 数 定义 有 

scanl f e undefined = e:undefined. 
原因 是 在 定义 中 ， 两 个 子 句 的 右边 都 是 e 开始 的 列表 ， 对 这 个 事实 无 需 知道 左边 是 什么 ， 
而 且 惰 性 计算 令 人 无 需 多 问 。 

库 函 数 定 义 还 使 用 了 case 表达 式 。 本 书 极 少 用 这 种 表达 式 ， 故 不 做 详细 介绍 。 
Haskell 允许 用 许多 方法 表达 同一 件 事 。 


6.6 最 大 连续 段 和 问题 


下 面 是 另 一 个 程序 计算 的 例子 。 最 大 段 和 和 (maximum segment sum) 问题 是 一 个 有 名 
的 问题 ， 其 历史 在 本 Bentley 的 《Programming Pearls》(1987) 中 有 描述 。 给 定 一 个 整数 序 
列 ， 要 求 计 算 序 列 中 所 有 段 (segment) 的 和 的 最 大 值 。 一 个 段 也 称 为 一 个 连续 子 序列 
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( contiguous subsequence ) 。 例 如 ， 对 序列 [ -1, 2，-3, 5，-2, 1, 3，-2，-2，--3， 

6] ,其 最 大 段 和 是 7， 它 是 [5，=2, 1， 3] 的 和 。 田 一 方面 , 序列 [【 =1，~2;，=3] 的 

最 大 段 和 是 0， 因 为 空 序列 是 每 个 列表 的 段 ， 其 和 是 0。 由 此 可 得 ， 最 大 段 和 总 是 非 负 的 。 
这 个 问题 可 以 如 下 说 明 : 


mss :: [Int] -> Int 
mss = maximum . map sum . segments 


其 中 segments 返回 一 个 列表 的 所 有 上 段 构成 的 列表 。 这 个 函数 有 多 种 定义 方法 ， 包括: 
segments = concat . map inits . tails 


其 中 tails 是 inits 的 对 偶 ， 它 返回 一 个 列表 的 所 有 尾 段 : 


tails :: [a] -> [[a]] 
tails [] = [[]] 


tails (x:xs) = (x:xs) :tails xs 


segments 的 定义 描述 了 取得 所 有 尾 段 的 首 段 的 过 程 。 例 如 : 


ghci> segments "abc" 
[" Li ， Wa "rab" nabcn ， 村 De e HPDCe wi ob 必 #] 


其 中 空 列表 出 现 了 4 次 ， 对 每 个 尾 段 出 现 一 次 。 

在 长 度 为 的 列表 上 直接 计算 mss 需要 的 步 数 正比 于 nn 。 因 为 总 共有 n 个 段 ， 每 个 
段 求 和 需要 nn 步 ， 所 有 总 共 需 要 n 步 。 求解 这 个 问题 是 否 可 以 做 得 比 三 次 方 更 好 ， 没 有 
明显 的 答案 。 

但 是 ， 看 看 程序 计算 会 给 出 什么 样 的 指引 。 首 先 安装 segments 的 定义 : 

maximum . map sum . concat . map inits . tails 
查看 可 以 使 用 的 定律 ， 发 现 

map f . concat = concat . map (map f£) 

可 以 应 用 到 中 间 的 项 map sum . concat。 由 此 得 到 

maximum . concat . map (map sum) . map inits . tails 
现在 可 以 使 用 定律 map f . map g = map (f . g) ， 得 到 

maximum . concat . map (map sum . inits) . tails 
对 了 ， 还 可 以 使 用 定律 : 

maximum . concat = maximum . map maximum 
是 不 是 ?不 是 的 ， 除 非 concat 的 参数 是 非 空 列表 的 非 空 列表 ， 因 为 空 列表 的 最 大 值 是 没 
有 定义 的 。 对 于 目前 的 例子 ， 这 个 定律 成 立 ， 因 为 inits 和 tails 均 返 回 非 空 列表 。 由 
此 得 到 


maximum . map (maximum . map sum . inits) . tails 


下 一 步 将 使 用 6.5 节 描 述 的 scanl 的 性 质 ， 即 


map sum . inits = scanl (+) 0 


由 此 得 到 
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maximum . map (maximum . scanl (+) 0) . tails 


现在 我 们 已 经 将 n 算法 简化 到 nw 算法 ， 所 以 已 经 取得 了 进展 。 现 在 看 似 卡 住 了 ， 因 
为 在 我 们 的 兵器 库 里 没有 定律 可 用 。 

下 一 步 明 显 地 有 关 maximum . scanl ( +) 0。 所 以 ， 先 来 看 看 对 下 列 式 子 能 证 明 
什么 。 

foldri max . Scanl (+) 0 


这 个 式 子 看 起 来 像 融合 律 ， 但 是 scanl ( +) 0 能 够 用 foldr 表达 吗 ? 是 的 ， 例 如 : 


scanl (+) 0 [x,y,Z] 
= [0,0+X,(O+X)+7，((O+X)+y)+Z] 
= [0 ,x,X+y,X+y+Z] 
= 0:map (x+) [0,y,y+z] 
= 0:map (x+) (scanl (+) 0 [y,z]) 


这 些 计算 显示 了 ( + ) 的 结合 律 以 及 0 是 (+ ) 的 单位 元 。 更 一 般 地 ， 这 些 结果 提示 我 们 只 
要 (@) 是 可 结合 的 ， 有 单位 元 e， 那 么 


scanl (@) e = foldr f [e] 
Where f x xs = e:map (x@) xs 


让 我 们 承认 这 个 定律 ， 继 续 寻 找 使 得 下 式 成 立 的 条 件 : 


foldri (<>) . foldr f [e] = foldr h b 
Where f x xs = e:map (x©) xs 


显然 foldr1l ( < > ) 是 严格 的 , 而 且 foldr1l (< >) [e] = e, 故 有 b=e。 接 下 来 需 
要 检查 融合 律 的 第 三 个 条 件 是 否 满足 : 对 所 有 x 和 所 有 xs ， 需 要 h 满足 


foldri (<>) (e:map (x@) xs) = h x (foldrl (<>) xs) 


等 式 的 左边 化 简 为 


e “> (foldri (<>) (map (x@) xs)) 


取 单 元 素 的 情况 xs = [y] ， 发 现 


hxy=e <> (xQ@ Jy) 


这 个 结果 给 出 h 的 定义 ,但 是 仍然 需要 检查 下 列 等 式 是 否 成 立 。 


foldrl (<>) (e:map (x@) xs) = e <> (x @ foldri (<>) xs) 


将 等 式 两 边 化 简 ， 该 等 式 成 立 的 条 件 是 


foldrl (<>) . map (x@) = (x@) . foldri (<>) 


最 后 一 个 等 式 成 立 的 条 件 是 (8 ) 对 于 ( < > ) 可 分 配 ， 也 就 是 
xXQ@(y<>2z)= (x Q@y) <> (xQ 2z) 

证 明 留 作 习题 。 
加 法 对 (二 元 ) 取 最 大 运算 可 分 配 吗 ? 是 的 : 


x+ (y `max” Z) = (x + y) “max (x + Z) 
X+ (y ‘min 2z) = (x + y) ‘min. (x + Z) 


再 返回 到 最 大 段 和 问题 。 已 经 得 到 了 


maximum . map (foldr (@) 0) . tails 

Where x @y=0 “max (x +y) 
得 到 的 这 个 结果 看 似 很 像 6.5 节 scanl 定律 的 一 个 特例 ， 只 是 这 里 使 用 了 foldr 而 不 是 
foldl ， 还 使 用 了 tails， 而 不 是 inits。 但 是 ， 进 行 与 scanl 类 似 的 计算 显示 


map (foldr f e) . tails = Scanr f e 


其 中 : 


scanr :: (a -> b -> b) -> b -> [a] -> [b] 
scanr f @ [] = [e] 
scanr f @ (x:xs) = f x (head ys):ys 

Where ys = scanr f ee xs 


图 数 scanr 在 标准 引导 库 也 有 和 定义。 总 之 ， 有 


mss = maximum . scanr (©@) 0 
where XQy= 0 “max (x + y) 


该 结果 是 求 最 大 段 和 的 线性 时 间 解 。 


6.7 习题 
习题 A 第 3 草 定 义 了 上 自然 数 乘法 。 下 面 是 稍 有 区 别 的 定义 : 


mult :: Nat -> Nat -> Nat 
mult Zero y = Zero 
mult (Succ x) y = mlt xy+y 
请 证 明 mult (x+v)z = mult xz + mult y zo。 证 明 只 能 利用 x+0 =x 和 和 (+) 满足 
结合 律 的 事实 。 所 以 ， 需 要 好 好 考虑 ，3 个 变量 x、y 和 z 中 ， 在 哪个 变量 上 归纳 最 好 。 
习题 B 证 明 : 对 于 所 有 的 有 穷 列表 xs 和 ys， 有 


reverse (XS 十 十 ys) = reverse ys ++ reverse XS 


可 以 假设 ( ++ ) 满足 结合 律 。 

习题 C” 还 记得 在 第 2 章 习 题 D 中 出 现 的 朋友 Eager Beaver 和 Lazy Susan 吗 ? Susan 喜 
欢 使 用 head . map f， 而 Beaver 更 中 意 E . head。 等 一 等 ! 这 两 个 表达 式 相等 吗 ? 请 用 
归纳 证 明 验 证 。 

习题 D ”回顾 第 5 章 的 笛 卡 儿 积 函数 cp :: [[a]] -> [[a]]。 用 适当 的 ft 和 e 给 
出 形 如 cp = foldr f e 的 定义 。 如 果 读 者 愿意 的 话 ， 可 以 使 用 列表 概括 表示 函数 f。 

本 习题 接 下 来 的 任务 有 关 下 面 恒等式 的 证 明 : 


length . cp = product . map length 


其 中 product 返回 一 个 数值 列表 元 素 的 乘积 。 
1. 使 用 融合 定律 将 length . cp 表示 成 foldr 的 特例 。 
2. 将 map length 表示 成 foldr 的 特例 。 
3. 再 一 次 利用 融合 定律 将 product . map length 表达 成 foldr 的 特例 。 
4. 检查 两 个 结果 应 是 相等 的 。 如 果 不 相等 ， 那 么 cp 定义 有 错误 。 
习题 E foldr 的 前 两 个 参数 是 列表 的 两 个 构造 函数 的 替代 物 : 
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(:) :: a -> [a] -> [a] 
DD :: [a] 


折 炙 函数 可 以 在 任何 数据 类 型 上 定义 : 只 需 将 数据 类 型 的 构造 函数 用 参数 代替 即 可 。 例 
如 ， 考 虑 下 面 的 数据 类 型 : 


data Either ab = Left a | Right Pb 


要 定义 折合 函数 ,需要 替换 下 列 构造 函数 : 


Left :: a -> Either a Pb 
Right :: b -> Either ab 
由 此 得 到 定义 : 


foldE :: (a -> c) -> (b -> c) -> Either ab -> 5c 

foldE f g (Left x) = fx 

foldE f g (Right x) = gx 
类 型 Either 不 是 递归 类 型 ， 所 以 foldaE 也 不 是 递归 函数 。 事 实 上 ，foldE 是 一 个 标准 
引导 库 函 数 ， 只 是 函数 名 为 either, 不 是 foldE。 

接着 为 下 列 类 型 定义 折 番 函数 。 


data Nat = Zero | Succ Nat 
data NEList a = One a | Cons a (NEList a) 


第 二 个 定义 引入 非 空 列表 。 
请 问 Haskell 的 folarl 有 什么 问题 ? 
习题 F 证 明 : 对 于 任意 有 穷 列表 xs ， 下 列 等 式 成 立 。 


foldl f e xs = foldr (flip f) e (reverse xs) 


再 证 明 ， 如 果 下 列 条 件 成 立 : 


(x <> y) Oz=x<> (y 0Q z) 
e @X = X <> e 


那么 对 于 所 有 有 穷 列表 xs 下 面 等 式 成 立 : 
foldl (@) e xs = foldr (<>) e xs 
习题 G ”利用 等 式 : 


foldl f e (xs ++ ys) = foldl f (foldl f e xs) ys 
foldr f e (xs ++ ys) = foldr f (foldr f e ys) xs 


证 明 下 列 等 式 : 


foldl f e . concat = foldl (foldl f) e 
foldr f e . concat = foldr (flip (foldr f)) e 


习题 H 在 数学 上 ， 下 列 式 子 的 值 是 什么 ? 


sum (Scanl (/) 1 [1..]) 


习题 1 由 下 面 的 说 明 计算 scanr 的 有 效 定义 。 


scanr f e = map (foldr f e) . tails 


习题 」 考虑 下 面 的 计算 问题 : 


mss ;+ Lintj => int 
mss = maximum . map sum . subsegs 
其 中 subseqs 返回 一 个 列表 的 所 有 子 序列 ， 包 括 它 本 喘 : 


subseqs :: [a] -> [[a]] 

subseqs [] = [[]] 

subseds (X:XS) = XSS ++ map (x:) xss 
Where xss = SubseqS XS 


求 mss 的 更 高 效 定义 。 133 | 
习题 K ”本 习题 的 问题 比较 零散 。 
1. 困 数 takePrefix p 应 用 于 列表 xs， 返回 xs 的 满足 p 的 最 长 前 级 。 因 此 


takePrefix :: ([a] -> Bool) -> [a] -> [al 


请 问 下 列表 达 式 的 值 是 什么 ? 


takePrefix nondec [1,3,7,6,8,9] 
takePrefix (all even) [2,4,7,8] 


请 完成 下 列 等 式 右边 部 分 。 


takePrefix (all p) = ... 


请 用 标准 图 数 ， 包 括 inits 给 出 takePrefix 的 定义 。 
本 题 最 后 将 会 讨论 takePrefix。 
2. 函数 one 和 ones 由 下 列 方程 定义 : 


one x = [x] 
none x = [] 


请 完成 下 列 恒 等 式 的 右边 部 分 。 
none . ff Wn $a 


map f . none = ... 
map f . one = ... 


3. 回顾 定义 fork (f,g) x = (f x,g Xx) ， 完 成 下 面 恒等式 。 


Fat o Tork (EE) ms 
Sh i rk Cf RY m 5 
fork (£8) .hh ms 


4. 定义 : 


test p (f,g) x = if p x then f x else gx 


请 完成 下 列 式 子 右 边 部 分 。 


toat pr (EE so 
h 。 test PP (fg) = oss 


函数 filter 可 以 定义 为 


filter p = concat . map (test p (one,none)) 


使 用 以 上 恒等式 以 及 其 他 标准 恒等式 ， 利 用 等 式 推理 证 明 下 列 等 式 。 


filter p = map fst . filter snd . map (fork (id,p)) 


(提示 : 像 常见 的 计算 一 样 ， 从 较 复杂 的 一 边 开 始 。) 
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5， 回 顾 第 4 章 习 题 K 答案 中 标准 引导 库 函 数 curry 和 uncurry 的 定义 : 


curry :: ((ayb) -> c) -> aa -> b -> 5 
curry f xy= £f (x,y) 


uncurry :: (a -> b -> c) -> (a,b) ->c 
uncurry f (x,y) =f xy 


请 完成 下 式 右 边 部 分 。 
map (fork (f,g)) = uncurry zip . (??) 


6. 再 返回 takePrefix， 请 利用 等 式 推理 计算 下 列表 达 式 的 有 效 程序 。 


takePrefix (p . foldl f e) 


要 求 £ 的 应 用 次 数 是 线性 的 。 


6.8 答案 
习题 A 答案 证 明 对 y 进行 归纳 : 
0 的 情况 
mult (x+0) Zz mult x z+ mult 0 Zz 
= {因为 x + 0=x} = {mult.1} 
mult x Zz mult x z+0 


= {因为 x + 0 = Xx} 
mult X Z 


y +1 的 情况 


mult (x+(y+1)) z mult x Z + mult (y+1) z 

= {因为 (+) 满 足 结 合 律 } = {mult .2} 

mult ((x+ty)+1) Zz mult x z+ (mlt y z+ 2z) 
= {mult.2} = {因为 (+) 满 足 结合 律 } 
mult (x+y) Z + Z (mult x z+ mlty Zz)+z 
= {归纳 假设 } 


(mult x z+ mlt yy Zz)+z 


习题 B 答案 ”证 明 对 xs 归纳 : 


[] 的 情况 

reverse ([]++ys) reverse ys ++ reverse [] 
= {++.1} = {reverse.1} 

reverse ys reverse ys ++ [] 


= {因为 xs ++ [] = xs} 


reverse ys 


x:xs 的 情况 
reverse ((X:XS)++yS) 
= {++.2} 
reverse (x:(xs++ys)) 
= {reverse.2} 
reverse (xst+ys) ++ [x] 
= {归纳 假设 } 


(reverse ys ++ reverse xs) ++ [Xx] 
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为 一 边 的 化 简 : 
reverse ys ++ reverse (x:xs) 
= {reverse.2} 
reverse ys ++ (reverse xs ++ [x]) 
= {根据 (++) 的 结合 律 } 
(reverse ys ++ reverse xs) ++ [x] 
习题 C 答案 ”我们 必须 证 明 对 于 所 有 的 列表 (有 穷 、 非 完整 和 无 穷 列表 ) 都 有 下 列 
等 式 成 立 。 


head (map f xs) = f (head xs) 


对 于 undefined 的 情况 和 归纳 情况 x:xs 容易 验证 ， 但 是 对 于 [] 的 情况 ， 得 到 


head (map f []) = head [] = undefined 


f (head []) = f undefined 
因此 ， 该 定律 只 有 当 f£ 是 严格 函数 时 成 并 。KEager Beaver 不 介意 这 个 问题 ， 因 为 它 只 构造 
严格 冰 数 。 


习题 D 答案 可 定义 : 


cp = foldr op [[]] 
where op xs xss = [x:ys | x <- xs, ys <- xss] 


1. length . cp = foldr hb 成 立 的 条 件 是 length 是 严格 的 (是 的 )， 而 且 下 列 
等 式 成 立 。 

length [[]] = 

length (op xs xss) = h xs (length xss) 

由 第 一 个 等 式 得 出 b =1， 因 为 


length (op xs xss) = length xs * length xss 


由 第 二 个 等 式 得 出 h = (*) . length。 

2. map length = foldr f [], 其 中 fxs ns = length xs:ns。 更 短 的 定义 是 
E Tuy a Loengtns 

3. product . map length = foldr h b， 只 要 product 是 严格 的 (是 的 ) 而 且 
下 列 等 式 成 立 。 


product [] = b 
product (length xs:ns) = h xs (product ns) 


由 第 一 个 等 式 得 出 b = 1， 因 为 


product (length xs:ns) = length xs * product ns 


由 第 二 个 等 式 得 出 h = (*) . length。 
4. hn 和 bb 的 定义 是 一 样 的 。 
习题 E 答案 folaN 的 定义 是 直接 的 : 


foldN :: (a -> a) -> a -> Nat -> a 
foldN f e Zero = e 
foldN f e (Succ n) = f (foldN f e n) 
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特别 是 
mi+n = foldN Succ m n 
m*n = foldN (+m) Zero n 
mn = foldN (*m) (Succ Zero) n 


对 于 非 空 列表 ，foldNE 的 定义 是 


foldNE :: (a -> b -> b) -> (a -> b) -> NEList a -> b 
foldNE f g (One x) = 名 工 
foldNE f g (Cons x xs) = f x (foldNE f g xs) 


作为 非 空 列表 上 的 合理 折 春 ，folarl 的 正确 定义 应 该 是 
foldri :: (a -> b -> b) -> (a -> b) -> [a] -> b 

foldri1 f g [x] =gxX 
foldri f g (x:xs) = f x (foldrl f g xs) 

Haskell 的 foldarl 定义 限制 g 为 恒 等 图 数 。 

习题 F 答案 ”为 简洁 起 见 , 记 g = flip f。 采 用 归纳 法 证 明 ， 对 于 任意 的 有 穷 列表 


xs 有 
foldl f e xs = foldr g e (reverse xs) 
[] 的 情况 
foldl f e [] foldr g e (reverse []) 
= {foldl.1} = {reverse.1} 
@ foldr g e [] 
= {foldr.1} 
e 


x:x8s 的 情况 
foldl f e (x:xs) 

= {foldl.2} 
foldl f (f e x) xs 


= {归纳 假设 } 
foldr g (f e x) (reverse xs) 


男 一 边 的 化 简 : 
foldr g e (reverse (x:xs)) 
= {reverse.2} 
foldr g e (reverse xs ++ [x]) 
= {需要 的 条 件 见 下 } 
foldr g (foldr g e [x]) (reverse xs) 
= {因为 foldr (flip f) e [x] = f @ x} 
foldr g (f e x) (reverse xs) 


需要 的 条 件 是 


foldr f e (xs ++ ys) = foldr f (foldr f e ys) xs 


证 明 留 给 读者 做 练习 3。 另外， 一 个 相伴 的 结 条 是 


foldl f e (xs ++ ys) = foldl f (foldl f e xs) ys 
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证 明 也 留 作 练习 。 
采用 归纳 法 证 明 ， 对 于 任意 有 穷 列表 xs ， 下 列 等 式 成 立 。 
foldl (@) e xs = foldr (<>) e xs 

基本 情况 的 证 明 容 易 。 归 纳 情况 的 证 明 如 下 : 
x:xs 的 情况 


foldl (@) e (x:xs) foldr (<>) e (x:xs) 
= {fo0ld1.2} = {foldr.2} 
foldl (@) (e @ x) xs X “> foldr (<>) e@ xs 
= {假定 @ @ x = x <> e} = {归纳 假设 } 
foldl (@) (x “> e) xs x <> foldl (@) e xs 


两 边 化 位 结果 不 同 。 需 要 为 一 个 归纳 假设 : 


foldl (@) (x <> y) xs = x <> foldl (@) y xs 


基本 情况 的 证 明 简 单 。 归 纳 迟 况 的 证 明 如 下 : 
z:zs 的 情况 
foldl (@) (x <> y) (z:zs) 
= {fo01d1.2} 
foldl (©@) ((x <> y) @ z) zs 
= {因为 (x <> y) @z= x <> (y © z)} 
foldl (@) (x <> (y @ z)) zs 
= {归纳 假设 } 
x <> foldl (@) (y @ z) zs 


为 一 边 的 化 简 : 
x <> foldl (@) y (z:zs) 
= {foldl.2} 
X <> foldl (@) (y Q@ z) zs 


习题 G 答案” 用 归纳 法 证 明 。 基 本 情况 的 证 明 人 简单 。 归 纳 情况 的 证 明 如 下 : 
foldl f e (concat (xs:xss)) 
= {concat 的 定义 } 
foldl f e (xs ++ concat xss) 
= {foldl 的 给 定性 质 } 
foldl f (foldl f e xs) (concat xss) 
= {归纳 假设 } 
foldl (foldl f) (foldl f e xs) xss 
= ” 任 o1d1 的 定义 } 
foldl (foldl f) e (xs:xss) 


为 一 边 的 化 人 简 : 
foldr f e (concat (xs:xss)) 
= {concat 的 定义 } 
foldr f e (xs ++ concat xss) 
= {foldr 的 给 定性 质 } 
foldr f (foldr f e (concat xss)) xs 
= {使 用 £1ip} 
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flip (foldr f) xs (foldr f e (concat xss)) 
= {归纳 假设 } 

flip (foldr f) xs (foldr (flip (foldr f)) e xss) 
= 任 oldr 的 定义 } 

foldr (flip (foldr f)) e (xs:xss) 


习题 H 答案 数学 上 表达 为 


sum (Scanl (/) 1 [1..]) = e 


因为 > 1/nl =e。 从 计算 的 角度 讲 ， 用 有 穷 列表 [1 . .n] 代 赫 [1 . . 1 给 出 。 的 一 个 逼近 。 
例如 : 


ghci> sum (scanl (/) 1 [1..20]) 
2.7182818284590455 

ghci> exp 1 

2.718281828459045 


标准 引导 库 消 数 exp 的 输入 为 一 个 数 x*， 返 回 值 为 e。 此 外 ， 引 导 库 函数 1og 的 输 
入 为 一 个 数 x， 人 返回 值 为 log.x。 如 末 需 要 其 他 底 的 对 数 ， 使 用 函数 logBase ， 其 类 型 为 


logBase :: Floating a => a ->a->a 


习题 1 答案 分 情况 合成 一 个 更 高 效 的 定义 。 基 本 情况 是 


scanr f e [] = [e] 


归纳 情况 x:xs 是 
scanr f e (x:xs) 
= {根据 说 明 } 
map (foldr f e) (tails (x:xs)) 
= {tails.2} 
map (foldr f e) ((x:xs):tails xs) 
= {map 的 定义 } 
foldr f e (x:xs):map (foldr f e) (tails xs) 
= {foldr.2 以 及 说 明 } 
f x (foldr f e xs):scan f e xs 
= {要求 :foldr f e xs = head (scanr f e xs)} 


f x (head ys):ys where ys = scanr f e xs 


习题 J 答案 ”站 和 完 ， 有 


subseqs = foldr op [[]] 
Where op X XSS = XSS ++ map (Xx:) xss 


利用 融合 定律 得 到 
map sum . subseqs = foldr op [0] 
Where op xX XS = XS ++ map (x+) xs 


再 利用 融合 定律 得 到 
maximum . map sum . subseqs = foldr op 0 
Where op Xy = 了 “max (x+y) 


这 个 定义 效率 不 错 。 当 然 ，sum . filter ( >0) 也 可 给 出 结果 。 
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习题 K 答案 
1. 表达 式 的 值 是 


takePrefix nondec [1,3,7,6,8,9] = [1,3,7] 
takePrefix (all even) [2,4,7,8] = [2,4] 


恒等式 为 
takePrefix (all p) = takeWhile P 
说 明 为 


takePrefix p = last . filter p . inits 


2. 恒等式 为 


none . ff = none 
map f . none = none 
mnapf . one = one .ff 


3. 恒等式 为 


fst . fork (f,g) 
snd . fork (f,g) 
fork (f,g) .hh 


4. 等 式 为 


test p (f,g) . h = test (p.h) (f . hb，g . h) 
h . test p (f,g) = test p (h . f,h. g) 


推理 如 下 : 
map fst . filter snd . map (fork (id,p)) 
= {filter 的 定义 } 


map fst . concat . map (test snd (one,none)) . 
map (fork (id,p)) 


还 


E 
fork (f.h,g.h) 


= {因为 map f . concat = concat . map (map f)} 
concat . map (map fst . test snd (one,none) . 
fork (id,p)) 

= {test 的 第 二 条 定律 ; one 和 none 的 定律 } 
concat . map (test snd (one . fst,none) . 
fork (id,p)) 

= {test 的 第 一 条 定律 ; fork 的 定律 } 
concat . map (test p (one . id, none . fork (id,p))) 

= {id 和 none 的 定律 } 
concat . map (test p (one,none)) 

= {filter 的 定义 } 


filter p 
5. 等 式 为 
map (fork (f,g)) = uncurry zip . fork (map f,map g) 
6. 推理 如 下 : 


filter (p . foldl f e) . inits 
= {filter 的 导出 定律 } 
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map fst . filter snd . 
map (fork (id, p . foldl f e)) . inits 


= {zip 的 定律 } 
map fst . filter snd . uncurry Zip . 
fork (id, map (p . foldl f e)) . inits 


= {fork 的 定律 } 
map fst . filter snd . uncurry zip . 
fork (inits, map (p . foldl f e) . inits) 


= {scan 引 理 } 
map fst . filter Snd . uncurry Zip . 
fork (inits, map p . scanl f e) 


因此 


takePrefix (p.foldl f e) 
= fst . last . filter snd . uncurry Zip . 
fork (inits,map p . scanl f e) 


6.9 注 记 


Gofer 是 较 早 由 Mark Jones 设计 的 一 个 Haskell 版 本 ， 命 名 来 目 于 GOod For Equational 
Reasoning。HUGS (The Haskell Users Gofer System) 是 GHCi 的 早期 版 本 ， 也 是 本 书 第 2 版 
使 用 的 系统 ， 但 是 目前 系统 已 不 再 维护 。 

许多 人 对 于 理解 函数 程序 中 的 定律 做 出 了 贡献 ， 不 好 一 一 列 出 。 下 列 Haskellwiki 网 页 
含 等 式 推理 的 例子 和 有 关 的 讨论 链接 : 

haskell. org/ haskellwiki/ Equational_reasoning_examples 

关于 最 大 段 和 问题 的 有 趣 历史 的 讨论 ， 参 考 Bentley 编写 的 《Programming Pearls》 

(second edition) (Addison- Wesley，2000 ) 。 
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效率 是 一 直 潜 伏 在 最 近 讨论 中 的 问题 ， 现 在 是 让 这 个 重要 问题 浮上 水 面 的 时 候 了 。 获 
得 效率 的 最 好 方法 当然 是 找到 解决 问题 的 好 算法 。 算 法 设计 是 一 个 很 广阔 的 领域 ,不 是 本 
书 的 基本 目的 。 不 过 ， 将 在 今后 接触 一 些 基 本 概念 。 本 章 集 中 在 一 个 更 基本 的 问题 上 : 馈 
数 程序 允许 人 们 构造 优美 的 表达 式 和 定义 ， 但 是 ， 人 们 是 否 知道 对 其 求 值 的 代价 呢 ? 美国 
的 一 位 计算 机 科学 家 Alan Perlis 曾经 算 改 奥斯卡 . 王尔德 关于 愤世嫉俗 的 人 的 名 言 : 图 数 
式 程序 设计 员 知 道 所 有 东西 的 价值 ， 但 是 不 知道 它们 的 价格 。 


7.1 情 性 求 值 
如 第 2 章 所 讲 ， 使 用 惰性 求 值 时 ， 诸 如 下 面 的 表达 式 : 


sqr (sqr (3+4) ) 


其 中 sqr x = x*x， 被 由 外 向 里 化 简 为 最 简单 的 形式 。 这 表示 函数 sqr 的 定义 首先 被 调 
用 ， 其 参数 在 需要 时 才 被 求 值 。 下 列 求 值 序列 遵循 以 上 规则 ， 但 并 不 是 惰性 求 值 : 


sqr (sqr (3+4)) 
= sqr (3+4) * sqr (3+4) 
= ((3+4)*(3+4)) * ((3+4)*(3+4)) 


= 2401 


倒数 第 2 行 省 略 号 隐藏 了 3 +4 和 7*7 不 少 于 4 次 的 求 值 。 显 然 ， 简单 地 将 参数 表达 式 代 
入 函数 定义 表达 式 是 一 个 非常 低 效 的 化 简 方 法 。 

但 是 ， 惰 性 求 值 保证 ， 如 果 需 要 参数 的 值 ， 那 么 对 参数 的 求 值 只 进行 一 次 。 使 用 惰性 
求 值 时 ， 化 简 序 列 大 致 如 下 : 


sqr (sqr (3+4)) 
= let x = SqT (3+4) in x*x 
= let y = 3+4 in 
let x = y*y in x*x 
= let y= 7 in 
let x = y*y in x*x 
= let x = 49 in x*x 
= 2401 


对 表达 式 3 +4 的 求 值 只 有 一 次 (7*7 的 求 值 也 只 有 一 次 )。 这 里 使 用 了 let 将 名 称 x 和 
y 约束 为 表达 式 ， 但 是 在 Haskell 实现 中 这 些 名 称 是 指向 表达 式 的 指针 。 当 一 个 表达 式 被 
化 简 为 一 个 值 时 ， 该 指针 指 回 这 个 什 ， 该 值 便 可 以 被 共享 (shared ) 。 

即便 如 此 ,“ 使 用 惰性 求 值 时 ， 参 数 只 有 在 需要 时 被 求 值 ， 而 且 只 求 值 一 次 !”， 这 个 
标题 并 没有 导出 所 有 真相 。 考 虑 sqr (head xs ) 的 求 值 。 为 了 对 sgr 求 值 ， 必 须 对 其 参 
数 求 值 ， 但 是 对 nead xs 求 值 并 不 需要 对 xs 的 所 有 元 素 求 值 ， 只 需 计算 到 形 如 y :ys 的 
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表达 式 即 可 。 此 时 ，head xs 返回 y，sqr (head xs) 返 回 y*y。 更 一 般 地 ， 如 果 一 
表达 式 是 函数 或 者 是 数据 构造 函数 (如 (:) ) 应 用 于 它 的 参数 形式 ， 则 称 表 达 式 是 和 
(head normal form ) 。 每 个 范式 (完全 化 简 的 式 子 ) 是 首 范式 ， 但 反 过 来 不 一 定 。 例 如 ， 
(el , e2 ) 是 首 范式 (因为 它 等 价 于 (,) el e2 ， 其 中 (, ) 是 二 元 组 的 构造 函数 ) 但 是 ， 
只 有 当 el 和 e2 均 为 范式 时 ， 该 表达 式 才 是 范式 。 当 然 ， 对 于 数值 和 布尔 值 ， 范 式 和 首 
范式 没有 区 别 。 

“使 用 惰性 求 值 时 ， 参 数 只 有 在 需要 时 被 求 值 ， 并 且 只 求 值 一 次 ， 而 且 此 时 只 计 
算 到 首 范式 ”， 这 种 叙述 虽然 不 如 前 面 的 叙述 容易 记忆 ， 但 是 它 的 确 是 惰性 求 值 更 好 
的 描述 。 

下 面 考虑 消 数 subseqs 归纳 情况 的 两 个 定义 ,该 函数 返回 一 个 列表 的 所 有 子 序列 : 


subseqs (x:xs) = subsegs xs ++ map (x:) (subseqs xs) 
subseqs (x:xXs) = xss ++ map (x:) xss 
Where xss = subsegs XS 


在 第 一 个 定义 中 ， 表 达 式 subseqs xs 在 等 式 右边 出 现 了 两 次 ， 所 以 ， 当 求 一 个 列表 的 子 
序列 时 ， 它 被 求 值 两 次 。 在 第 二 个 定义 中 ,程序 员 察 觉 到 这 种 重复 工作 ， 并 用 where 子 
句 确 保 subseqs xs 只 被 求 值 一 次 (也 可 以 使 用 let 表达 式 ) 。 

重要 的 是 ， 作 为 程序 员 ， 可 以 控制 使 用 哪个 定义 。 让 Haskell 识别 表达 式 的 重复 出 现 ， 
并 使 用 与 内 部 Let 表达 式 等 价 的 式 子 将 其 代 蔡 ， 这 种 方法 是 可 行 的 。 这 就 是 众所周知 的 

公共 子 表 达 式 消去 (common subexpression elemination) 技术 。 但 是 ，Haskell 没有 这 样 做 ， 

而 且 有 其 道理 : 这 样 做 可 能 引起 空间 泄漏 (space leak)。subseqs (x:xs) 第 二 个 定义 存 
在 的 问题 : 列表 subseqs xs 只 构造 一 次 ， 但 是 因为 它 的 值 被 再 次 使 用 ， 即 在 第 二 个 表达 
式 map (x;) xss 中 ， er ed 

对 比 以 上 两 个 定义 : 第 一 个 定义 花 的 时 间 长 ， 因 为 其 中 有 重复 的 计算 ; 第 二 个 定义 更 
快 (尽管 仍然 是 指数 阶 的 )， opp genre 这 是 因为 ,长度 为 n 的 列表 有 2" 
个 子 序 列 。 在 程序 设计 中 永远 不 能 避 开 一 分 为 二 的 原则 : 要 避免 重复 的 工作 ， 必 须 用 空间 
将 一 次 计算 的 结果 存储 起 来 。 

下 面 是 一 个 相关 的 例子 。 考 虑 一 个 脚本 中 的 下 列 两 个 定义 


fool n = sum (take n primes) 

where 

primes = [x | x <- [2..], divisors x == [xj] 
divisors x = [d | d <- [2..x], x ‘mod d == 0] 


foo2 n = sum (take n primes) 
primes = [x | x <- [2..], divisors x == [xj]] 
divisors x = [d | d <- [2..x], x “mod d == 0] 


编写 fool 的 程序 员 将 primes 和 divisors 的 定义 局 限于 fool 的 定义 ， 因 为 预计 
这 两 个 定义 不 会 在 脚本 的 其 他 定义 中 用 到 。 编 写 foo2 的 程序 员 将 这 两 个 辅助 函数 的 定义 
作为 全 局 定义 或 者 顶层 (top-level) 定义 。 读 者 或 许 认为 两 种 定义 的 效率 没有 区 别 ， 但 是 
考虑 下 列 与 CHCi 的 交互 。( 命 令 :set +s 开启 一 些 统计 功能 ， 在 表达 式 求 值 后 打印 这 些 
数据 。) 
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ghci> ;Set +S 

ghci> fool 1000 

3682913 

(4.52 secs，648420808 bytes) 
ghci> fool 1000 

3682913 

(4.52 secs, 648412468 bytes) 
ghci> foo2 1000 

3682913 

(4.51 secs, 647565772 bytes) 
ghci> foo2 1000 

3682913 

(0.02 secs, 1616096 bytes) 


为 什么 foo2 1000 的 第 二 次 求 值 比 第 一 次 快 得 多 ,但 是 fool 1000 的 两 次 求 值 花 的 
时 间 一 样 多 ? 答案 是 foo2 的 定义 需要 列表 primes 的 前 1000 个 元 素 ， 所 以 求 值 后 
primes 指 问 一 个 存储 了 前 1000 个 素数 的 列表 ， 第 二 次 foo2 1000 的 求 值 不 需要 再 次 计 
算 这 些 素 数 。 在 系统 内 部 ， 脚 本 运行 的 空间 已 经 增长 ， 因 为 primes 至 少 占 据 了 1000 个 
单位 的 内 存 。 

第 三 个 程序 员 选 择 如 下 定义 foo: 


foo3 = \n -> sum (take n primes) 

where 

primes = [x | x <- [2..], divisors x == [xj] 
divisors x = [d | dad <- [2..x], x ‘mod d == 0] 


这 里 使 用 了 兰 姆 达 表 达 式 在 函数 层 表示 foo3 ， 除 表示 方法 外 实质 上 与 fool 完全 一 样 。 
下 列 定义 同样 可 行 : 
foo3 = sum . flip take primes 


但 是 稍 显 模 糊 。 现 在 可 以 进行 求 值 : 


ghci> foo3 1000 
3682913 


(3.49 secs，501381112 bytes) 
ghci> foo3 1000 
3682913 


(0.02 secs，1612136 bytes) 


同样 ， 第 二 次 求 值 比 第 一 次 快 得 多 。 这 是 为 什么 呢 ? 
为 了 看 清 问题 ， 可 以 将 两 个 函数 重 写成 下 面 形式 : 


fool n = let primes = ... in 
sum (take n primes) 
foo3 = let primes = ... in 


\n -> sum (take n primes) 


现在 可 以 看 出 ， 每 次 对 fool 1000 求 值 都 需要 对 primes 重新 求 值 ， 因 为 primes 
是 绑 定 在 晒 数 fool 的 应 用 中 ， 而 不 是 绑 定 在 该 函数 本 和 刁 。 理 论 上 可 以 使 第 一 个 定义 中 的 
局 部 函数 定义 依赖 于 n， 这 样 的 局 部 定义 对 于 每 个 n 均 需 要 重新 求 值 。 在 第 二 个 定义 中 ， 
局 部 函数 定义 绑 定 于 函数 本 身 (而 且 不 可 能 依赖 于 函数 的 任何 参数 )， 结 果 是 它们 只 需求 
值 一 次 。 当 然 ， 对 foo3 1000 求 值 后 ，primes 的 局 部 定义 将 扩展 成 1000 个 元 素 的 显 式 
列表 ， 接 看 是 如 何 继续 求 值 的 方法 。 
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7.2 空间 的 控制 


假设 将 sum 定义 为 sum = foldl ( +) 0。 使 用 惰性 求 值 策 略 ， 表 达 式 sum [1 . .1000 ] 
的 化 简 过 程 如 下 : 


sum [1i. .1000] 
= foldl (+) 0 [1..1000] 
= foldl (+) (0+1) [2. .1000] 
= foldl (+) ((0+1)+2) [3. .1000] 


foldl (+) (..((0+1)+2)+ ... +1000) {[] 


= (..((0+1)+2)+ ... +1000) 
= 500500 


求 值 过 程 中 首先 需要 1000 个 单位 空间 来 构造 前 1000 个 数 之 和 的 算术 表达 式 ， 然 后 再 
对 其 求 值 。 
更 好 的 方法 是 混合 使 用 惰性 和 勤奋 求 值 : 
sum [1. .1000] 
= foldl (+) 0 [1..1000] 
= foldl (+) (0+1) [2..1000] 
= foldl (+) 1 [2..1000] 


= foldl (+) (1+2) [3. .1000] 
= foldl (+) 3 [3..1000] 


foldl (+) 500500 {[] 
= 500500 


这 里 列表 表达 式 [1 . .1000 ] 的 求 值 是 惰性 的 ， 但 是 foldal 的 第 二 个 参数 累加 和 求 值 是 勤 
奋 的 。 交 叉 使 用 惰性 求 值 和 勤奋 求 值 的 结果 是 ， 求 值 过 程 使 用 的 内 存 空 间 是 常数 。 
上 例 表 示 ， 控 制 化 简 的 次 序 将 是 有 益 的 。 提 供 这 种 方法 的 原始 函数 是 seq， 类 型 为 


SOQ 7 a -> b> 


对 x “seq`y 求 值 的 次 序 是 ， 先 对 x 求 值 (到 首 范式 ) ， 然 后 返回 对 y 求 值 的 结果 。 如 果 
对 x 的 求 值 不 终止 ，x ` seq`y 的 求 值 也 不 终止 。 在 Haskell 中 不 能 定义 seq， 因 此 
Haskell 将 该 函数 定义 为 原始 函数 。 

现在 考虑 fo01d1 的 下 列 版 本 f01d1',， 该 函数 对 第 二 个 参数 是 严格 的 : 

foldl' :: (b -> a -> b) -> b -> [al ->b 

ol1d1* 0] = e 

foldl' f e (x:xs) = y ‘seq foldl' fy xs 

Where y= fex 

Haskell 在 标准 引导 库 中 提供 了 该 函数 〈 而 且 使 用 了 这 个 乏味 的 名 )。 现 在 可 以 定义 sum = 
foldl1'( + ) 0， 结 果 是 求 值 使 用 常数 空间 。 事 实 上 ，sum 是 一 个 引导 库 男 数 ， 而 且 基 本 
上 是 这 样 定 义 的 。 

是 不 是 函数 foldl 现在 变 得 多 余 ， 可 以 被 foldal' 替 代 呢 ? 在 实际 中 是 的 ， 但 是 在 理 
论 上 不 是 。 可 以 构造 f、e 和 xs 使 得 


foldl f e xs 天 foldl' f e xs 


获 这 101 


但 是 ， 如 果 £ 是 严格 的 (如 果 f 上 = 上 ， 则 称 / 是 严格 的 ) ， 则 以 上 两 个 表达 式 返回 相同 的 
结果 。 具 体 细 广 将 在 习题 中 讨论 。 


取 平 均值 


有 了 以 上 准备 工作 ， 现 在 考虑 一 个 很 能 说 明 问 题 的 例子 : 如 何 计算 一 个 数值 列表 的 平均 
值 (mean) 。 当 然 问 题 很 简单 ， 读 者 可 能 会 想 ， 只 需 将 列表 元 系 之 和 除 以 列表 长 度 即 可 : 

mean :: [Float] -> Float 

mean xs = Sum xs / length xs 
这 个 定义 有 许多 错误 : 不 单单 是 右边 的 式 子 不 是 类 型 正确 的 ! 函数 length 在 Haskell 的 
类 型 是 [a] -> Int ， 不 进行 类 型 显 式 转换 不 可 以 做 Float 和 Int 的 除法 。 

在 标准 引导 库 中 存在 完成 这 种 转换 的 旺 数 : 


fromIntegral :: (Integral a, Num b) => a -> hb 
fromIntegral = fromInteger . tolnteger 


注意 到 在 第 3 章 有 了 两 个 转换 函数 : 
toInteger :: (Integral a) => a -> Integer 
fromInteger :: (Num a) => Integer -> a 


第 一 个 将 任何 整 型 转换 为 整数 ， 第 二 个 将 整数 转换 为 一 个 数值 。 它 们 的 复合 将 一 个 整 型 
数 ， 如 Int ， 转 换 为 更 一 般 的 数 ， 如 Float。 

现在 可 以 重 写 mean 如 下 : 

mean :: [Float] -> Float 

mean xs = sum XS / fromIntegral (length xs) 

这 个 定义 的 第 二 个 问题 是 ， 定 义 默 默 地 忽略 了 空 列表 的 情况 。 如 何 处 理 0/0? 或 者 用 
错误 信息 的 方式 说 明 这 种 失败 的 情况 ,或 者 采用 惯例 说 明 空 列表 的 均值 是 0: 


mean [] = 0 
mean xs = sum xs / fromIntegral (length xs) 


现在 可 以 仔细 检查 mean 真正 有 什么 问题 ， 它 会 引起 空间 泄漏 。 计算 mean [1 . .1000] 
将 会 使 得 列表 扩展 ， 并 在 求 和 后 继续 保留 在 内 存 ， 因 为 在 计算 其 长 度 时 有 指向 列表 的 第 二 
个 指针 。 

可 以 使 用 所 谓 的 元 组 (tupling) 策略 优化 ， 用 列表 的 一 次 遍历 代替 两 次 遍历 。 对 本 例 
来 说 方法 很 简单 ， 定 义 函数 sumlen: 

sumlen :: [Float] -> (Float,Int) 

sumlem xs = (sum xs,length xs) 
然后 给 出 避免 两 次 遍历 的 男 一 种 定义 。 其 中 的 计算 容易 实现 ， 这 里 只 给 出 结果 : 

sumlen [] = (0,0) 

sumlen (x:xs) = (s+x,n+1) where (s,n) = sumlen XS 

函数 sumlen 定义 的 模式 应 该 是 熟悉 的 。 男 一 种 定义 是 


sumlen = foldr f (0,0) where f x (s,n) = (s+x,n+1) 


甚至 更 好 的 方法 是 用 folal g 代替 foldr E， 其 中 : 
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E (s,n) x = (stx,n+1) 


这 样 做 的 理由 是 第 6 章 的 定律 : 
foldr f e xs = foldl g e xs 


对 于 所 有 列表 xs 成 立 ， 只 要 满足 条 件 : 


fx (gyz)=g (fxy)z 
f= 


这 两 个 条 件 的 验证 留 作 练习 。 
这 也 表明 ， 可 以 用 foldal 定义 : 
sumlen = foldl' g (0,0) where g (s,n) x = (stx,n+1) 
现在 可 以 用 下 列 定义 代 兰 备 受 批评 的 mean 定义 : 


mean [] = 0 
mean xs = 8 / fromIntegral n 
where (s,n) = sumlen xs 


现在 确实 达到 了 使 用 常数 空间 计算 mean 的 目的 了 吗 ? 很 不 幸 ， 没 有。 问题 在 
sumlen 中 ， 而 且 不 容易 发 现 。 将 定义 稍稍 展开 ， 可 以 发 现 


foldl' f (s,n) (x:xs) = y ‘seq foldl' f y xs 
Where y = (st+x,n+1) 


哇 ， 但 是 y `seq` z 将 y 化 简 成 首 范式 ， 而 且 (s +x,n =1) 已 经 是 首 范式 。 两 个 分 量 在 
这 个 计算 完成 前 不 会 得 到 求 值 。 这 表示 需要 进一步 深入 seq， 并 将 sumlen 重 写 如 下 : 


sumlen = foldl' f (0,0) 
where f (s,n) x=s ‘seq nn ‘seq (stx,n+1) 


最 后 ,一切 圆满 ， 均 值 的 计算 在 常数 空间 完成 。 


; 另外 两 个 函数 应 用 运算 


函数 应 用 是 唯一 不 使 用 显 式 符号 表示 的 和 运算。 但 是 ，Haskell 提供 另外 两 个 应 用 运算 
妈 ($) 和 ($1!): 


infixr 0 $,$! 

($) ,($!) :: (a -> b) -> a -> 

f $x = 人 x 

f $! x=X seq fx 

函数 应 用 £ x 和 ££ $! x 的 唯一 区 别 是 ， 在 第 二 个 表达 式 中 ,将 £ 应 用 于 参数 x 之 前 
先 计算 x 的 值 。 函 数 应 用 Ex 和 fE $ x 的 唯一 区 别 是 ($) (还 有 ($1)) 被 说 明 具 有 最 
低 的 优先 级 0， 而 且 是 右 结 合 的 。 这 也 恰恰 是 前 面 第 一 行 优先 级 提供 的 声明 。 为 什么 需要 
这 些 运 算 呢 ? 答案 是 ， 现 在 可 以 编写 形 如 下 面 的 式 于 : 


Processl $ process2 $ process3 input 


否则 ， 需 要 如 下 表达 : 


process1 (process2 (process3 x)) 
(Processl1 . process2 . process3) x 


不 可 否认 的 是 ( $ ) 在 某 些 场合 是 很 有 用 的 ， 特 别 是 在 提交 GHCi 计算 表达 式 时 ， 所 以 


符 


- 
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该 运算 符 值得 一 提 。 根 据 以 上 讨论 ， 严 格 应 用 运算 符 ( $ ! ) 也 是 很 和 用 的 。 


7.3 运行 时 间 的 控制 


可 以 看 出 ， 在 仪表 盘 上 设置 一 个 “勤奋 ”按钮 是 控制 计算 占用 空间 的 一 种 最 简单 方 
法 ， 但 是 如 何 控制 运行 时 间 呢 ? 不 幸 的 是 ， 没 有 类 似 的 能 够 加 速 计 算 的 按钮 ， 不 过 我 们 必 
须 理解 哪些 会 无 意 中 降 低 计 算 速 度 。Haskell 平台 编译 器 GHC 附带 文档 中 包含 如 何 使 得 程 
序 运 行 更 快 的 有 用 建议 。 文 档 中 有 3 个 关键 建议 : 

。 使 用 CHC 的 性 能 分 析 (profiling) 工具 。 分 析 程 序 的 运行 时 间 和 使 用 的 空间 是 不 

可 替代 的 。 本 书 不 讨论 性 能 分 析 工 具 ， 但 是 有 必要 说 明 这 些 工 具 的 存在 。 

e。 改进 程序 性 能 的 最 好 方法 是 使 用 更 好 的 算法 。 本 章 开 篇 就 提 到 这 点 。 

。 使 用 库 函 数 要 比 使 用 用 户 自己 的 限 数 好 得 多 ， 因 为 这 些 库 函 数 是 由 其 他 人 认真 设 
计 和 细心 测试 过 的 。 用 户 可 以 设计 一 个 比 库 Data .List 提供 的 排序 (sort) 更 
好 的 排序 函数 ， 但 是 这 会 花费 比 写 下 import Data.List (sort) 长 得 多 的 时 
间 。 使 用 GHCi 时 情况 更 是 如 此 ， 因 为 CHCi 会 调用 标准 库 中 函数 的 编译 版 本 。 编 
译 版 本 通常 比 解 释 版 本 快 一 个 数量 级 。 

GHC 文档 提供 的 建议 细节 超出 了 本 书 范 围 ， 但 是 这 里 可 以 解释 两 个 窗 门 。 第 一 个 ， 
展 性 求 值 的 管理 比 勤 奋 求 值 的 管理 需要 更 多 的 开销 ， 所 以 ， 如 果 知 道 一 个 函数 的 值 会 被 用 
到 ， 那 么 最 好 按 下 勤奋 键 。 如 文档 所 讲 :“ 严 格 防 数 是 你 的 好 朋友 ”。 

第 二 个 建议 有 关 类 型 。 首 先 ，Int 上 的 算术 运算 快 于 Integer 上 的 算术 ， 因 为 
Haskell 在 处 理 潜在 的 大 数 时 需要 完成 更 多 的 工作 。 所 以 ， 在 确保 安全 的 条 件 下 使 用 Int， 
不 使 用 Integer。 其 次 ， 如 果 将 函数 类 型 说 明 为 所 需要 的 具体 类 型 ，Haskell 便 可 以 减少 
开 文 。 例 如 ， 考 虑 7. 1 市 定义 的 函数 fool 的 类 型 ， 在 定义 孔 数 时 没有 说 明 其 类 型 (实际 
上 其 他 相关 函数 也 没有 说 明 类 型 )， 这 是 错误 的 ， 可 以 看 出 它 的 类 型 是 

fool :: Integral a => Int -> a 

如 果真 正 感 兴趣 的 是 前 n 个 素数 之 和 ， 最 好 声明 fool 的 类 型 。 例 如 : 


fool :: Int -> Integer 


有 了 这 个 更 具体 的 定义 ，Haskell 无 需 随 身 携带 类 族 Integral 的 方法 和 实例 字典 ， 
因此 减轻 了 负担 。 

这 些 建议 可 以 减 去 常量 的 运行 时 间 ， 但 是 不 会 影响 渐进 时 间 复 杂 度 ， 即 时 间 复 杂 度 函 
效 的 阶 。 但 是 ， 人 们 有 时 会 无 意 写 出 比 预 期 渐进 复杂 度 差 的 函数 。 考 虑 第 5 章 讨 论 的 笛 卡 
儿 积 函 数 Cp: 

cp [DD = [[]] 

cp (xs:xss) = [x:ys | x <- xs, ys <- cp xss] 
定义 看 似 优 雅 、 清 晰 ， 但 是 与 下 列 定义 对 比 一 下 : 

cp' = foldr op [[]] 

where op xs yss = [x:ys | x <- xs, ys <- yss] 
第 一 个 定义 使 用 了 直接 递归 ， 而 第 二 个 定义 使 用 foldr 来 表达 递归 。 两 个 “算法 ”是 相 
同 的 ， 是 不 是 ? 不 过 ， 有 
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ghci> sum $ map sum $ cp [[i..10] | j <- [1i..6]] 
33000000 

(12.11 secs, 815874256 bytes) 

ghci> sum $ map sum $ cp' [[1..10] | j <- [i..6]] 
33000000 

(4.54 secs, 369640332 bytes) 


表达 式 sum $ map sum 主要 是 为 了 强迫 笛 卡 儿 积 进行 完全 求 值 。 为 什么 第 一 个 计算 的 速 


度 只 有 第 二 个 计算 的 1/3? 答案 是 ， 检 查 第 一 个 定义 中 消去 列表 概括 的 表示 : 
cp [] = [[]] 


cp (xs:xss) = concat (map f xs) 
Where f x = [x:ys | ys <- cp xss] 


可 以 看 出 ， 每 次 f 应 用 于 xs 的 元 素 时 ，cp xss 都 要 求 值 一 次 。 也 就 是 ，cp 在 第 一 个 例 
子 中 的 计算 次 数 远 远 多 于 它 在 第 二 个 例子 中 的 计算 次 数 。 目 前 难以 给 出 更 精确 的 数字 ， 但 
是 下 面 会 引入 估算 运行 时 间 的 演算 。 不 过 ， 问 题 已 经 很 清楚 : cp 的 简单 递归 定义 无 意 导 
致 了 计算 量 大 于 预期 。 

更 有 效 的 笛 卡 儿 积 定义 如 下 : 

ep 0 “ TID 


cp (xs:xss) = [x:ys | x <- xs, ys <- yss] 
Where yss = cp XSS 


该 定义 的 性 能 与 使 用 foldr a 这 里 得 到 的 经 验 是 ， 看 似 简 单 的 列表 概括 
可 能 掩盖 了 有 些 表达 式 尽管 只 写 了 一 次 , 但 是 会 计算 多 次 的 事实 。 


7.4 ”时间 分 析 


给 定 一 个 函数 的 定义 ， 用 7T(f) (n) 表示 将 f 应 用 于 “规模 ”为 n 的 参数 时 ， 求 值 过 
程 中 化 简 步 数 在 最 坏 情况 下 的 渐进 估计 。 为 了 稍 后 解释 的 原因 ， 假定 7 的 定义 中 使 用 的 求 
值 方 法 是 勤奋 求 值 ， 而 不 是 惰性 求 值 。 

对 于 了 的 定义 需要 一 些 澄清 。 第 一 ，T(P 表示 j 的 一 个 给 定 定义 的 复杂 度 。 时 间 复 
杂 度 是 一 个 表达 式 的 性 质 ， 而 不 是 表达 式 值 的 性 质 。 

第 二 ， 化 人 简 步 数 不 完 全 等 同 于 提交 表达 式 求 值 和 求 得 结果 期 间 逝 去 的 时 间 。 对 于 较 长 

日 复杂 的 表达 式 化 简 ， 定 义 并 没有 考虑 寻找 下 一 个 要 化 简 的 子 表 达 式 所 需要 的 时 间 。 基 于 
这 个 原因 ，GHCi 的 统计 工具 没有 计算 化 简 步 数 ， 只 是 输出 逝去 的 时 间 。 

第 三 ， 没 有 给 规模 的 概念 下 定义 ， 因 为 不 同 的 场合 有 不 同 的 规模 度量 。 例 如 ， 对 
xs ++ys 求 值 时 ， 最 好 用 两 个 列表 的 长 度 二 元 组 (m,n) 表示 规模 。 对 concat xss 求 
值 时 ， 可 以 用 concat xss 的 长 度 作为 规模 ， 而 当 xss 是 长 度 为 m 的 列表 ， 其 中 每 个 元 
素 又 都 是 长 度 为 n 的 列表 时 ， 用 (m，n) 作为 规模 可 能 更 合理 。 

第 四 ， 也 是 最 重要 的 一 点 ，7(f) (n) 是 在 勤奋 求 值 模型 下 估算 出 来 的 。 原 因 很 简单 ， 
计算 惰性 求 值 中 的 化 简 步 数 很 困难 。 例 如 ， 考 虑 定义 minimum = head . sort。 在 勤奋 
求 什 模型 下 ， 使 用 该 定义 对 个 元 素 列 表 求 最 小 值 的 时 间 复 杂 度 是 

T(minimum)(n) = T(sort)(n) +T(head)(n) 
换 句 话说 ， 必 须 将 长 度 为 n 的 列表 完全 排序 ， 然 后 取 排 序 结果 的 第 一 个 元 素 (应 该 是 常数 


艾 这 105 


时 间 的 运算 ) 。 这 个 等 式 对 于 惰性 求 值 不 成 立 ， 因 为 找到 sort xs 的 第 一 个 元 素 所 需要 的 
化 简 步 数 只 需要 将 sort xs 化 简 为 首 范式 即 可 。 这 个 过 程 需 要 多 少 步 依赖 于 sort 所 使 
用 的 算法 。 在 勤奋 求 值 模型 下 ， 时 间 的 分 析 要 简单 得 多 ， 因 为 分 析 是 可 组 合 的 (composi- 
tional ) 。 因 为 惰性 求 值 所 需 步 数 总 是 少 于 勤奋 求 值 步 数 ， 所 以 T(f) (n) 的 任何 上 界 也 是 
惰性 求 值 步 数 的 上 界 ， 而 且 在 许多 场合 ， 一 个 下 界 也 是 惰性 求 值 的 下 界 。 

为 了 举例 分 析 时 间 复 杂 度 ， 需 要 先 介绍 一 点 有 关 阶 的 表示 。 在 讨论 效率 时 一 直 在 使 用 
“ 步 数 正比 于 ”这 样 的 词语 。 现 在 是 引入 更 简洁 记 法 的 时 候 了 。 给 定 两 个 自然 数 上 的 函数 了 
和 g， 如 果 存 在 大 于 0 的 常数 C, 和 C, 以 及 一 个 自然 数 no 使 得 对 于 所 有 n>no,，Cig(n) = 
f(n) 志 Cg(n) 成 立 ， 则 称 f 是 g 阶 的 ， 记 作 f= 8B(g)。 换 句 话 说 ， 对 充分 大 的 n, f 的 下 
界 和 上 界 都 是 g 的 常数 倍 。 

这 种 记号 被 滥用 到 人 们 通常 写 得 很 简洁 ， 如 写成 f(n) = @(n )， 而 不 是 写成 正确 的 形 
式 f(n) =@(An.n)。 类 似 地 ， 人 们 写成 fn) = 8(n)， 而 不 写 f(n) = 8(id)。 使 用 9Q 记 
号 主要 是 隐藏 常数 ， 例 如 ， 可 以 写 


Di- 8) 和 了 = 9(m) 


在 这 里 人 们 不 在 意 忽略 的 常数 。 
有 了 这 些 背 景 知识 ， 下 面 给 出 3 个 例子 ， 说 明 如 何 分 析 一 个 计算 的 运行 时 间 。 首 先 考 
虑 concat 的 两 个 定义 : 


concat xss = foldr (++) [] xss 
concat' xss = foldl (++) [] xss 


如 果 xss 是 有 穷 列表 ， 那 么 这 两 个 定义 是 等 价 的 。 假 定 xss 是 长 度 为 m 的 列表 ， 其 
中 每 个 元 素 都 是 长 度 为 n 的 列表 ， 那 么 第 一 个 定义 给 出 : 
T(concat)(m,n) = T(foldr (++) [|])(m,n) 
T(foldr(++)[ |])(0,n) = (1) 

T(foldr(++)[ |])(m+1,n)= T(++)(n,mn) + T(foldr(++)[ |) (m,n) 
其 中 估算 式 7T( ++ )(n,， mn) 来 自 将 长 度 为 n 的 列表 与 长 度 为 mn 的 列表 串联 的 工作 。 因 
为 T( ++)(n,，m) =@(n)， 由 此 得 到 

T(foldr(++)[ |])(m,n) = 2, O(n) = OQ(mn) 
对 于 concat 的 第 二 个 定义 ， 有 
T(concat')(m,n) = T(foldl1(++))(0,m,n) 
T(foldl(++))(k,0,n) = OQ(1) 

T(foldl(++))(k,m+1,n)= T(++)(k,n) + T(foldl(++))(k+n,m,n) 

其 中 附加 参数 上 表示 foldl A 由 此 得 到 


T(folqdl(++))(k,m,n) = 5 0 +jn) = OQ(k + mn) 


因此 T(concat'’)(m, n) =Q(m’'n)。 结论 是 第 6 章 所 预测 的 ， 在 concat 定义 中 使 
用 foldr 而 不 使 用 foldal 可 以 得 到 渐进 运行 更 快 的 程序 。 
第 二 个 例子 计算 7. 1 节 讨 论 的 subseqs 的 两 个 程序 的 运行 时 间 ， 该 函数 的 两 个 可 能 
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的 定义 是 
subseqs (X:XS) = subsegs XS ++ map (X:) (subseqs XS) 


subseqs' (x:xs) = xss ++ map (x:) xss 
Where XSS = subsegs' xs 


需要 记 住 : ( 1 ) 如 果 xs 的 长 度 为 n， 那么 subseqs xs 的 长 度 是 2";( Hi ) 串联 和 
应 用 map (x: ) 的 时 间 是 8(2")， 两 个 运行 时 间 分 析 给 出 : 
T(subseqs)(n+1)= 27T(subseqs)(n) + Q(2") 
T(subsegqs')(n+1)= T(subseqs’')(n) + @(2") 
男 外 有 7T(subseqs)(0) =@(1)。 下 面 仅 给 出 两 个 解 (可 以 用 简单 归纳 法 证 明 ): 
T(subseqs)(n) = OQ(n2") 
T(subseqs')(n)= 的 (2 ) 
可 见 ， 后 者 比 前 者 在 渐进 时 间 复 杂 度 上 快 一 个 对 数 因 子 。 
第 三 个 例子 计算 本 市 开始 讨论 的 cp 的 两 个 程序 的 运行 时 间 。 第 一 个 定义 是 
cp [] = [[]] 
cp (xs:xss) = [x:ys | x <- xs, ys <- cp xss] 
再 次 假定 xss 是 长 度 为 m 的 列表 ， 列 表 的 每 个 元 素 又 都 是 长 度 为 m 的 列表 。 这 样 
cp xss 的 长 度 是 n”"。 由 此 得 到 
T(cp)(0,n) = (1) 
T(cp)(m+1,n)= nT(cp)(m,n) + Q(n”) 
这 是 因为 应 用 (x: ) 于 每 个 子 序列 需要 @(n") 步 。 最 后 得 到 的 解 是 
T(cp)(m,n) = OQ(mn”) 
男 一 方面 ， 用 foldr 定义 的 cp 给 出 : 
T(cp)(0,n)= 0(1) 
T(cp)(m+1,n)= T(cp)(m,n) + OQ(n”) 
其 解 为 T(cp)(m, n) =@(n”")。 因 此 ,第 二 个 定义 渐进 更 快 ， 同 样 快 一 个 对 数 因子 。 


7.5 累积 参数 


有 时 可 以 通过 给 函数 增加 一 个 额外 参数 ， 称 为 累积 参数 (accumulating parameter)， 从 
而 改进 计算 的 运行 时 间 。 典 型 的 例子 是 晒 数 reverse: 


reverse [] = [] 
reverse (X:XS) = reverse xs ++ [x] 


对 于 这 个 定义 ，T(reverse)(n) =@(n )。 为 了 找到 线性 时 间 的 程序 ， 假 如 定义 : 
revcat :: [a] -> [a] -> [al 
revcat xs ys = TeVerse XS ++ ys 
显然 ，reverse xs = revcat xs [] ， 所 以 ， 如 果 能 够 得 到 revcat 的 高 效 定 义 ， 
那么 也 可 以 得 到 reverse 的 高 效 定义 。 为 此 ， 下 面 计算 revcat 的 递归 和 定义。 基本 情况 
revcat [] ys =ys 留 作 练习 ， 归 纳 情况 如 下 : 
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revcat (x:xs) ys 
= {revcat 的 定义 } 
reverse (X:XS) ++ ys 
= {reverse 的 定义 } 
(reverse xs ++ [x]) ++ ys 
= {(++) 满足 结合 率 } 
reverse XS ++ ([x] ++ ys) 
= {(:) 的 定义 } 
reverse Xxs ++ (Xx:ys) 
= {revcat 的 定义 } 
revcat xs (x:ys) 


因此 ， 有 


revcat [] ys = ys 
revcat (x:xs) ys = revcat xs (x:ys) 


对 于 运行 时 间 ，7T( revcat ) (m,n) =@(m)。 特 别 是 
T(Eeverse(n) 三 T(reveat(n0) = @(n) 

由 此 得 到 一 个 线性 时 间 的 列表 求 逆 程序 。 

下 面 是 男 一 个 例子 。 函 数 length 定义 如 下 : 


length :: [a] -> Int 

length [] = 0 

length (x:xs) = length xs + 1 
有 7T(length)(n) =@(n)， 所 以 , 计算 男 一 个 定义 不 会 在 运行 时 间 上 有 所 收获 。 不 过 ， 
如 下 定义 函数 lenplus: 

lenplus :: [a] -> Int -> Int 

lenplus xs n = length xs + 1n 

如 果 对 lenplus 完全 重复 以 上 对 revcat 进行 的 计算 过 程 ， 则 可 得 到 


lenplus [] n = 1n 
lenplus (x:xs) n = lenplus xs (1i+n) 


计算 过 程 可 行 的 原因 是 (+ ) 像 (++ ) 一 样 也 满足 结合 律 。 现 在 如 下 定义 length: 


length xs = lenplus xs 0 = foldl (\n x -> 1+n) 0 xs 


这 个 定义 的 优点 是 ， 通 过 fo191' 代 替 foldl ， 一 个 列表 的 长 度 可 以 在 常数 空间 算出 来 。 
确实 ， 这 也 是 Haskell 引导 库 函 数 length 的 定义 。 

敏锐 的 读者 可 能 已 经 注意 到 ， 没 有 必要 进行 上 面 的 计算 。 事 实 上 ， 两 个 例子 都 是 第 6 
章 描述 的 一 个 定律 的 特例 ， 即 


foldr (<>) e xs = foldl (@) e xs 


只 要 下 列 条 件 成 立 : 
X<> (y Q@z) 一 (<>y) Qz 


xX <> 在 二 下 fx 


这 两 个 特例 是 
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foldr (\x n -> n+1) 0 xs = foldl (\n x -> i+n) 0 xs 
foldr (\x xs -> xs++[x]) [] xs 
= foldl (\xs x -> [x]++xs) [] xs 


这 两 个 等 式 验证 的 细 广 留 作 练习 。 
作为 累积 参数 的 最 后 一 个 例子 ， 我们 从 列表 转向 树 。 考 虑 下 列 数 据 声明 : 


data GenTree a = Node a [GenTree al 


这 个 类 型 的 元 素 由 一 个 带 标 记 的 结 点 和 一 些 子 树 的 列表 构成 。 这 种 树 出 现在 用 状态 和 
转移 描述 的 问题 中 。 一 个 结 点 的 标记 说 明 当 前 状态 ， 子 树 的 数目 表示 在 当前 状态 下 可 能 的 
转移 数目 。 每 棵 子 树 都 有 一 个 标记 说 明 该 转移 后 的 新 状态 ， 其 子 树 描述 在 新 状态 下 可 以 进 
行 的 转移 ， 等 等 。 

下 面 是 计算 一 棵 树 中 标记 列表 的 函数 : 


labels :: GenTree a -> [al 
labels (Node x ts) = x:concat (map labels ts) 


方法 很 简单 : 计算 每 棵 子 树 的 标记 ， 将 这 些 结果 连接 在 一 起 ， 并 将 树 的 标记 放 在 最 后 列表 
的 前 面 。 

现在 分 析 这 个 程序 在 树 上 上 的 运行 时 间 。 为 简单 起 见 ， 假 是; 是 高 度 为 h 的 完美 (per- 
fect)k- 元 树 。 也 就 是 说 ， 如 果 h=1， 那 么 1 没有 子 树 ; 如 果 h >1， 那 么 t+ 恰好 有 此 棵 子 树 ， 
每 棵 子 树 的 高 度 是 hh 一 1。 这 种 树 上 的 标记 数 s(h,，k) 满足 

sl 1 
s(h+l,k)=1 + ks(h,k) 
由 此 得 到 解 s(h,，k) = ©( 刀 )。 现 在 有 
T(labels)(l1,k) = QO(1) 

T(labels)(h+1,k)= OQ(1) +T(concat)(k,s) + T(map labels)(h,k) 
其 中 s =s(h,， 上)。 表 达 式 T(map labels)(h,〖k) 估算 将 map labels 应 用 于 高 度 均 为 
h 的 树 构成 的 长 度 为 的 列表 的 运行 时 间 。 一 般 地 ， 给 定 一 个 长 度 为 的 列表 ， 其 中 列表 
元 素 的 规模 都 是 n， 那 么 

T(map f)(k,n) = kT(f£)(n) + OQ(k) 
因为 T(concat)(k, s) =9( 必 ) =@(k*")。 所 以 ， 有 
T(labels)(h+1,k) = QO(k"'') + kT(l1abels)(h,k) 
这 是 因为 8(1) +@(k) =@(k)。 最 后 的 解 是 
T(labels)(h,k) = @(hk") = QO(s log s) 

换 句 话说 ,利用 以 上 定义 计算 树 的 标记 的 运行 时 间 渐 进 地 比 树 的 规模 大 一 个 对 数 
因子 。 

下 面 看 一 个 累积 参数 能 市 来 什么 。 定 义 lapbcat: 

labcat :: [GenTree a] -> [a] -> [al 

labcat ts xs = concat (map labels ts) ++ xs 
除了 添加 一 个 列表 参数 xs 外 ,将 第 一 个 参数 由 一 棵 树 推广 到 树 的 列表 。 此 时 
labels t = labcat [t] []， 所 以 , 对 labcat 的 任何 改进 将 导致 对 labels 的 改进 。 
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现在 可 以 合成 labcat 的 男 一 个 定义 。 对 于 基本 情况 有 
labcat [] xs = xs 


对 于 归纳 情况 有 如 下 推理 : 
labcat (Node x us:vs) xs 
= 汪 义 } 
concat (map labels (Node x Us:VS8)) ++ XS 
= {定义 } 
labels (Node x us) ++ concat (map labels VS) ++ XS 
= (和 仍 义 } 
x:concat (map labels us) ++ concat (map labels vs) ++ XS 
= {labcat 的 定义 } 
x:concat (map labels us) ++ labcat vs xs 
= {也 是 labcat 的 定义 } 
x:labcat us (labcat vs xs) 


以 上 计算 的 结果 是 下 列 的 labels 程序 : 


labels t = labcat [t] {[] 
labcat [] xs = XS 
labcat (Node x us:vs) = x:labcat us (labcat vs xs) 


对 于 时 间 复 杂 度 的 分 析 , 令 T(labcat)(h, kk，n) 表示 labcat ts xs 的 运行 时 间 ， 其 
中 ts 是 长 度 为 n 的 树 的 列表 ， 每 棵 树 是 高 度 为 h 的 完美 元 树 (忽略 了 xs 的 规模 ， 因 
为 它 不 影响 时 间 的 估算 ) 。 那 么 

T(labcat}(h,r0) = @(0) 

T(labcat)(l,k,n+1)= (1) +T(labcat)(l,k,n)) 
T(labcat)(h+l,k,n+1)= O(1) +T(labcat)(h,k,k) + T(labcat)(h+1,k,n) 
解 前 两 个 方程 得 到 T(1labcat ) (1, kk, n) =@(n), 利用 归纳 法 得 到 7T(1abcat) 

(h, 上,，n) =B(kn)。 因 此 
T(labels)(h,k) = T(labcat)(h,k,1) = OQ(k) = ©(;s) 
这 表示 可 以 用 正比 于 树 的 规模 的 时 间 计 算 一 棵 树 的 标记 ， 相 对 第 一 个 版 本 改进 了 一 个 对 数 
因子 。 


7.6 元 组 


在 讨论 函数 mean 时 提 到 了 两 个 函数 的 元 组 。 元 组 是 累积 参数 的 某 种 对 偶 : 推广 一 个 
盟 数 时 给 输出 添加 一 个 额外 的 结果 ， 而 不 是 添加 额外 的 输入 参数 。 
展示 元 组 魅力 的 典型 例子 是 韭 波 那 契 函数 : 
fib :: Int -> Integer 
fipbpO0O=0 
fib1i=1 
fib n = fib (n-1) + fib (n-2) 
用 这 3 个 方程 求 fib 的 时 间 由 下 列 式 子 估算 : 
T(f15)(0) = @(1) 
T(fib)(1) = @(1) 
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T(£fiB)(n)= T(fib)(n -1)+T(fib)(n -2)+Q(1) 
因此 ， 时 间 函 数 满 足 的 方程 非常 类 似 于 fib 方程 本 身 。 事 实 上 , T(fib)(n) =8@(g")， 
其 中 小 是 黄金 比 由 =(1 +V5)/2。 这 表示 对 fib 在 输入 为 n 的 求 值 运 行 时 间 是 n 的 指数 
图 数 。 
现在 考虑 如 下 定义 的 fip2 : 


fib2 n = (fib n,fib (n+1)) 


显然 fib n = fst (fib2 n)。 合成 fib2 的 直接 递归 定义 后 得 到 

fib2 0 = (0,1) 

fib2 n = (b,atb) where (a,b) = fib2 (n-1) 
这 个 程序 的 运行 时 间 是 线性 的 。 在 这 个 例子 中 ， 元 组 的 策略 导致 了 戏剧 性 的 改进 ， 由 指数 
时 间 降 至 线性 时 间 。 

利用 一 般 定 律 刻 画 效 率 的 改进 是 很 有 趣 的 。 一 个 这 样 的 定律 有 关 下 列 计算 


(foldr f a xs, foldr g b xs) 


如 上 式 所 示 ， 两 个 foldr 的 应 用 涉及 xs 的 两 次 遍历 。 所 以 ,设计 一 个 只 遍历 列表 一 
次 的 定义 不 仅 在 时 间 上 有 收获 ， 而 且 可 能 在 空间 性 能 上 也 有 收获 。 事 实 上 ， 有 


(foldr f a xs, foldr gb xs) = foldr h (a,b) xs 


其 中 ， 


hh (Ws) 


结果 可 以 用 归纳 法 证 明 ， 将 此 留 作 习题 。 
作为 男 一 个 例子 ， 再 次 由 列表 转向 树 。 不 过 这 次 的 树 有 些 不 同 ， 它 是 标记 叶 的 二 又 树 
( leaf-labelled binary tree ) : 


data BinTree a = Leaf a | Fork (BinTree a) (BinTree a) 


不 同 于 以 上 讨论 的 GenTree, 一 棵 BinTree 是 一 个 有 标记 的 叶 ， 或 者 由 两 棵 二 叉子 树 构 
成 的 二 叉 树 。 

假如 要 用 一 个 给 定 的 标记 列表 构建 一 棵 二 叉 树 。 更 确切 地 说 ,我 们 想 定 义 一 个 函数 
build， 而 且 对 于 任意 非 空 列表 xs 满足 


labels (build xs) = xs 


其 中 labels 返回 一 棵 二 又 树 的 标记 : 


labels :: BinTree a -> [al] 
labels (Leaf x) = [x] 
labels (Fork u v) = labels u ++ labels v 


我 们 感 兴趣 的 是 可 能 的 优化 ， 而 且 labels 的 定义 表示 可 以 用 累积 参数 改进 定义 。 尽 
管 如 此 ,但 这 并 非 主要 目的 ， 这 种 优化 留 作 习题 。 
一 种 构建 树 的 方法 是 将 列表 的 一 半 元 素 用 于 构建 左 子 树 ， 必 一 半 元 系 构 建 右 子 树 : 


build :: [a] -> BinTree a 

build [x] = Leaf x 

build xs = Fork (build ys) (build zs) 
Where (ys,2Zs) = halve xs 
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阴 数 halve 在 4.8 节 出 现 过 : 


halve xs = (take m xs,drop m xs) 
Where m = length xs “div” 2 


可 见 ，halve 将 一 个 列表 拆 分 为 两 个 基本 相等 的 列表 。Halve 的 定义 涉及 列表 的 过 有 历 以 
便 求 出 列表 的 长 度 ， 男 外 的 两 个 (部 分 ) 遍历 求 出 两 个 子 列表 。 因 此 ， 应 用 元 组 方法 是 得 
到 更 好 定义 的 首要 选择 。 但 是 ， 对 于 labels 暂时 不 考虑 这 个 特定 的 优化 ， 也 不 考虑 
build 的 定义 满足 其 规格 说 明 的 证 明 。 所 以 ， 已 有 3 个 计算 留 作 习 题 ， 我 们 专注 于 第 四 
个 问题 。 
现在 计算 buila 的 时 间 : 
T(build)(1)= @(1) 
T(build)(n)= T(build)(m) +T(puild)(n-m) +OQ(n) 
where m= n div 2 
将 长 度 为 n 的 列表 拆 分 需要 B(n) 步 ， 然 后 分 别 用 长 度 为 m 和 长 度 为 nm 的 列表 递归 地 
构建 两 棵 子 树 。 方 程 的 解 是 
Tpuila)(n) 三 O(n log™%) 
换 句 话说 ， 使 用 以 上 方法 构建 一 棵 树 更 为 耗 时 ， 其 时 间 是 列表 长 度 的 一 个 对 数 因子 。 
有 了 这 个 结果 后 ， 再 来 定义 buil1aq2 : 
build2 :: Int -> [a] -> (BinTree a, [a]) 
build2 n xs = (build (take n xs),drop n xs) 
这 个 定义 用 列表 的 前 nn 个 元 素 构 建 一 棵 树 ， 同 时 把 剩余 的 列表 作为 结果 返回 。 此 时 有 


build xs = fst (build2 (length xs) xs) 


所 以 ， 原 盟 数 可 以 用 元 组 定义 的 函数 表示 。 
现在 的 目的 是 构造 build2 的 直接 递归 定义 。 首 先 ， 显 然 有 


build2 1 xs = (Leaf (head xs) ,tail xs) 


build2 n xs = (Fork (build (take m (take n xs))) 
(build (drop m (take n xs))), 
drop n xs) where m = n “div. 2 
该 等 式 是 将 build 代入 递归 步骤 得 来 的 。 这 也 表示 下 一 步 需要 使 用 take 和 drop 的 性 
质 。 它 们 是 ， 如 果 m <= n， 那 么 


take m . take n = take m 
drop m . take n = take (n-m) . drop m 


由 此 得 到 


build2 n xs = (Fork (build (take m xs)) 
(build (take (n-m) (drop m xs))), 
drop n xs) where m= n “div. 2 


利用 buila2 的 定义 ， 可 以 将 上 式 重 写 如 下 : 


名 
1 
BY 


112 


build2 n xs = (Fork u v, drop n xs) 


Where (u,xs') = build2 m xs 
(Vv,xXS8'') = build2 (n-m) xs' 
m =n “div” 2 
但 是 ， 作 为 最 后 一 步 ， 注 意 到 
xs'' = drop (n-m) xs' 
= drop (n-m) (drop m xs) 
= drop n XS 


因此 ， 现 在 可 以 再 次 将 pui1g2 重 写 为 
build2 1 xs = (Leaf (head xs) ,tail1 xs) 
build2 n xs = (Fork u v, xs'') 
Where (u,xs') = build2 m xs 
(Vv,xs'') = build2 (n-m) X8， 
m =n "div” 2 
估算 其 运行 时 间 得 到 
T(build2)(1) = 8(1) 
T(build2)(n)= T(build2)(m) +T(pbpuild2)(n-m)+Q(1) 
其 解 为 T(buila2 )(n) = 9(n) 。 因 此 ， 利 用 buila2 作为 辅助 函数 ，bui1d 的 运行 时 间 
改进 了 一 个 对 数 因子 。 


7.7 排序 

排序 是 一 个 内 容 广 泛 的 话题 ， 人 们 可 以 花 上 很 多 愉快 的 时 光 讨 论 不 同 的 算法 。Knuth 
在 他 的 系列 专 铸 《The Art of Computer Programming》 第 三 卷 中 用 了 400 页 讨论 这 一 话题 。 
即便 如 此 ， 在 纯 函 数 式 的 背景 下 ， 某 些 排序 的 结论 仍然 需要 重新 陈述 。 本 节 对 两 个 排序 算 
法 进行 简短 讨论 ， 并 时 刻 关 注 对 算法 的 可 能 优化 。 


归并 排序 
归并 排序 (Mergesort) 在 4.8 节 有 定义 ， 


sort :: (Ord a) => [a] -> [al 
sort [] = [] 
sort [x] = [x] 
sort xs = merge (sort ys) (sort zs) 
Where (ys ,ZS) = halve xs 
halve xs = (take m xs,drop m XS) 
Where m = length xs ‘div 2 


实际 上 通过 归并 的 排序 有 多 种 版 本 ， 标 准 引 导 库 的 函数 sort 使 用 的 定义 不 同 于 这 里 
的 定义 。 

如 前 所 述 ，halve 的 定义 看 似 相 当 低 效 ， 因 为 它 需 要 对 参数 进行 多 次 遍历 。 一 种 改 
进 方法 是 利用 标准 引导 库 函 数 splitAt ， 其 说 明 如 下 : 


splitht ;2 TInt =» [al -> {La], [a]) 
splitAt n xs = (take n xs,drop n xs) 


该 限 数 的 引导 库 定 义 使 用 了 元 组 转换 : 
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splitAt 0 xs = ([] ,xs) 
splitAt n [] = (《[] , 口 ) 
splitAt n (x:xs) = (x:ys,2Zs) 
Where (ys,2Zs) = splitAt (n-1) xs 
很 容易 使 用 下 面 两 个 事实 计算 nalve 的 定义 : 对 于 任意 0<n 有 
take n (x:xs) = x:take (n-1) xs 
drop n (x:xs) = drop (n-1) xs 
现在 可 以 定义 : 


halve xs = splitAt (length xs ‘div 2) xs 


当然 ， 这 里 仍然 有 两 次 过 历 。 

另 一 种 改进 sort 的 方法 是 定义 : 

sort2 n xs = (sort (take n xs),drop n xs) 
有 sort xs = fst (sort2 (length xs) xs)， 有 所 以 原来 的 排序 函数 可 以 在 通用 的 排序 
中 抽取 。 通 过 与 前 面 的 sort 几乎 完全 一 样 的 计算 可 以 得 到 


sort2 0 xs = ([] ,xs) 
sort2 1 xs = ([head xs|,tail xs) 
sort2 n xs = (merge ys zs, xs'') 


Where (ys,xs') = sort2 m xs 
(Zs,xXS'') = sort2 (n-m) xs' 
m =n ‘div 2 


利用 这 个 定义 ,不 需要 计算 长 度 ， 也 没有 对 xs 的 多 次 遍历 。 

男 一 种 优化 halve 的 方法 是 意识 到 ， 如 果 必 须 手 工 将 一 个 列表 分 成 两 部 分 ， 不 会 如 
上 这 样 做 。 如 果 要 求 将 一 个 列表 分 成 两 部 分 ， 一定 会 用 如 下 方法 将 列表 元 系 分 成 两 堆 : 

halve [] = CL] ,£1) 

halve [x] = ([x],[]) 

halve (x:y:xs) = (x:ys,y:2Zs) 

where (ys,2Zs) = halve xs 

当然 ， 这 个 定义 返回 的 结果 不 同 于 前 一 定义 的 结果 ， 如 果 拆 分 后 的 结果 要 排序 ， 那 么 
拆 分 后 两 个 列表 的 元 素 顺 序 没 有 关系 ， 重 要 的 是 所 有 元 素 都 在 茶 一 子 列表 中 。 

现在 已 经 总 共有 3 种 改进 sort 性 能 的 方法 ,但 结果 是 没有 一 个 方法 对 sort 总 的 运 
行 时 间 有 很 大 的 改进 。 或 许 改进 了 几 个 百分点 ， 但 是 没有 实质 的 改进 。 而 且 ， 如 采 使 用 
GHCi 做 函数 求 值 姻 ,没有 一 种 定义 在 性 能 上 比 得 过 库 函 数 sort ， 因 为 这 个 函数 是 用 编译 
的 形式 提供 给 用 户 的 ， 而 且 编 译 后 的 函数 通常 运行 会 快 十 倍 。 当 然 ， 我 们 总 是 可 以 用 GHC 
编译 函数 。 


快速 排序 


第 二 个 排序 算法 是 有 名 的 快速 排序 (Quicksort)。 这 个 排序 只 需要 两 行 Haskell 代码 
描述 : 


sort :: (Ord a) => [a] -> [a] 

sort [] = [|] 

sort (x:xs) = sort [y | y <- xs, y < x] ++ [x] ++ 
sort [y | y <- xs, x <= y] 
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这 个 定义 非常 优美 ， 也 是 Haskell 表现 力 的 证 明 。 但 是 ,优美 也 是 有 代价 的 : 程序 在 空间 
开销 方面 可 能 非常 低 效 。 情 况 与 前 面 mean 的 程序 一 样 。 

在 讨论 如 何 优化 代码 之 前 ， 先 来 计算 T(sort )。 假 设 要 对 长 度 为 n+1 的 列表 排序 。 
第 一 个 列表 概括 可 能 返回 任何 长 度 左 介 于 0 和 nn 之 间 的 列表 ， 因 此 第 二 个 列表 概括 结果 的 长 
度 是 -8。 因 为 运行 时 间 函 数 是 最 后 运行 时 间 的 佑 计 ， 所 以 需要 取 这 些 可 能 性 中 最 大 者 : 

T(sort)(n+1) = max [T(sort)(k) +T(sort)(n-k)|lko—[0..n||+Q(n) 
其 中 @(n) 项 表示 计算 两 个 列表 概括 和 完成 列表 串联 的 运行 时 间 。 顺 便 指出 ， 以 上 列表 概 
括 是 在 数学 表达 式 中 的 应 用 ， 而 不 是 Haskell 表达 式 中 的 应 用 。 如 果 列 表 概 括 在 程序 设计 
中 是 有 用 的 记号 ， 那 么 它们 在 数学 中 一 样 是 有 用 的 。 

最 坏 的 情况 在 上 =0 或 者 有 =n 时 发 生 ， 尽 管 不 是 很 明显 。 因 此 ， 有 

T(sort)(0) = @(1) 
T(sort)(n+1)= T(sort)(n) + O(n) 

由 此 得 到 解 7(sort) =@(n )。 所 以 , 快速 排序 在 最 坏 情 况 下 是 平方 阶 的 算法 。 这 是 算 
法 本 身 的 特点 ， 无 关 Haskell 的 表达 方式 。 快 速 排序 的 名 望 来 目 两 个 原因 ， 但 是 两 者 在 纯 
国 数 程序 情况 下 都 不 成 立 。 第 一 ， 当 快速 排序 用 数组 实现 ， 而 不 是 用 列表 时 ， 划 分 过 程 可 
以 原 地 (in place) 完成 ， 无 需 更 多 额外 空 s 间 。 第 二 ， 在 对 输入 的 一 些 合理 假设 下 ， es 
排序 的 平均 情况 性 能 是 (nlogn)， 而 且 其 中 的 常数 很 小 。 在 函数 式 程序 设计 情况 下 ， 这 
常数 不 是 很 小 ， 而 且 有 比 快速 排序 更 好 的 排序 方法 。 

有 了 这 些 分 析 ， 让 我 们 看 看 在 不 做 实质 性 改变 的 情况 (不 是 一 个 完全 不 同 的 排序 算 
法 ) 下 如 何 改 进 算法 。 为 了 避免 划分 时 做 两 次 裔 历 ， 定 义 : 


partition p xs = (filter p xs, filter (not . p) xs) 


这 是 另 一 个 将 两 个 定义 作为 二 元 组 以 节约 一 次 饥 历 的 例子 。 因 为 filter p 可 以 表示 成 
foldr 的 一 个 特例 ， 故 可 利用 folqdr 的 元 组 定律 得 到 


partition p = foldr op ([],[]) 
Where op x (ys,2zs) | px = (xXx:ys,2Z8) 
| otherwise = (ys,x:Zs) 


现在 可 以 定义 : 


sort [] = [] 
sort (x:xs) = sort ys ++ [x] ++ sort zs 
Where (ys,2s) = partition (<x) xs 


不 过 这 个 定义 仍然 有 空间 泄漏 问题 。 为 了 解释 原因 ， 将 递归 情况 写成 如 下 等 价 形式 : 


sort (x:xs) = sort (fst p) ++ [x] ++ sort (snd p) 
where p = partition (<x) xs 


假如 x:xs 的 长 度 为 n+1， 而 且 列 表 元 素 是 严格 递减 的 ， 那么 x 是 列表 的 最 大 元 了 率 ， 
p 是 长 度 分 别 为 n 和 0 的 列表 二 元 组 。 显 示 第 一 个 递归 调用 结果 引发 对 p 的 求 但， 但 是 P 
的 第 一 个 分 量 占 用 的 空间 不 能 释放 ， 因 为 在 第 二 个 递归 调用 中 有 指 问 p 的 引用 。 在 第 二 个 
递归 调用 中 间 ， 有 更 多 的 列表 二 元 组 生成 并 保留 在 内 存 。 总 之 ， 对 长 度 为 n+1 的 严格 递 
减 列表 进行 排序 需要 的 总 空间 是 @(n ) 单位 。 这 意味 着 现实 中 对 于 大 输入 的 排序 会 因为 
没有 足够 空间 而 退出 。 
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解决 方法 是 强制 partition 的 求 值 ， 同 样 重 要 的 是 ， 绑 定 ys 和 zs 到 二 元 组 的 分 
量 ， 而 不 是 p 本 身 。 
一 种 得 到 满意 结果 的 方法 是 引入 两 个 累积 参数 ， 如 下 定义 sortp: 


sortp x xs us VS = sort (us ++ ys) ++ [x] ++ 
sort (vs ++ ZS) 
Where (ys,2zs) = partition (<x) xs 


这 样 便 有 


sort (x:xs) = sortp x xs [] [] 


现在 可 以 为 sortp 合成 一 个 直接 递归 定义 。 基 本 情况 定义 为 


sortp x [] us vs = sort US ++ [x] ++ sort VS 171] 


对 于 归纳 情况 yx:xs， 假 设 Y < x。 那 么 
sortp x (y:xs) us VS 

= {sortp 的 定义 以 及 (ys,zs) = partition (<x) xs} 
sort (us ++ y:ys) ++ [x] ++ sort (vs ++ zs) 


= { 见 以 下 的 断言 } 


sort (yi:us ++ ys) ++ [x] ++ sort (vs ++ zs) 
= {sortp 的 定义 } 
sortp XxX (y:us) vs 
其 中 的 断言 是 ， 如 果 as 是 bs 的 一 个 置换 ， 那么 sort as 和 sort bs 返回 同一 个 结果 。 
断言 直观 上 是 显然 的 : 对 一 个 列表 排序 ， 结 果 不 依赖 于 输入 元 素 的 排列 次 序 ， 只 依赖 于 列 
表 中 的 元 素 。 形 式 证 明 略 去 。 
对 于 x <= y 的 情况 再 进行 类 似 的 计算 ， 并 使 sortp 局 部 于 sort 的 定义 ， 得 到 最 


后 的 程序 : 
sort [] = [] 
sort (x:xs) = sortp xs [] [J 
where 
sortp [] us vs = sort us ++ [x] ++ sort vs 


sortp (y:xs) us vs = if y <x 
then sortp xs (y:us) vs 
else sortp xs us (y:vs) 


尽管 程序 看 上 去 没有 以 前 那么 深 亮 ,但 是 至 少 空间 复杂 度 是 ©(n) 。 


7.8 习题 
习题 A 图 数 sort 的 一 个 简单 定义 是 
sort 口 = [] 


sort (x:xs) = insert x (sort xs) 
insert x [] = [x] 
insert x (y:ys) 
= if x <= y then x:y:ys else y:insert x ys 
这 种 排序 方法 称 为 插入 排序 (insertion sort) 。 请 用 惰性 求 值 将 sort [3 ,4,2,1] 化 为 
首 范式 。 然 后 回答 下 列 问题 ( i ) 将 heaqd . sort 应 用 于 长 度 为 n 的 列表 时 ， 对 该 表达 
式 求 值 需要 多 长 时 间 (作为 n 的 函数 )?( i) 使 用 勤奋 求 值 又 需要 多 长 时 间 ? 〈 氨 ) 使 用 
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惰性 求 值 时 ， 插 入 排序 完成 的 比较 序列 是 否 与 下 列 选择 排序 ( selection sort) 完成 的 比较 


序列 一 样 ? 
sort [] = [] 
sort xs = y:sort ys where (y,ys) = select xs 
select [x] “ (x,[]y 
select (x:xs) | x <= y = (xX,y:ys) 


| otherwise = (y,x:ys) 
where (y,ys) = select xs 


习题 B 请 给 出 length 的 一 个 定义 ， 其 求 值 可 用 常数 空间 完成 。 写 出 length 的 第 
二 个 定义 ， 其 求 值 在 常数 空间 完成 ， 但 是 不 使 用 原始 运算 seq ( 直接 地 或 者 间接 地 ) 。 

习题 C ”请 给 出 上 、e 和 xs 使 得 

foldl Ee@xs 交 Eoladl' £ es 

习题 D 如果 如 下 定义 cp: 

cp [] = [[]] 

cp (xs:xss) = [x:ys | ys <- cp xss, XxX <- XS] 

请 问 这 样 定义 cp 是 不 是 像 使 用 foldr 定义 的 cp 一 样 高 效 ? 是 ， 不是， 还 是 也 许 ? 

下 面 做 一 个 计算 。 使 用 fo1dr 的 融合 律 计 算 下 列 函 数 的 高 效 定义 : 


fcp = filter nondec . cp 


关于 nondec 的 定义 参见 4.7 节 。 
习题 E ”假设 对 于 n=2 有 下 列 递 推 式 : 
7(1) = 9(1) 
T(n)= T(n div2) + T(n -ndiv2) + OQ(n) 
请 证 明 7(2 ) =@(2%) 。 由 此 证 明 T(z) =@(nlogn)。 
习题 F 证 明 : 


foldr (\x n -> n+1) 0 xs = foldl (\n x -> 1+n) 0 xs 
foldr (\x xs -> xs++[x]) [] xs 
= foldl (\xs x -> [x]++xs) [] xs 


习题 G 证 明 : 如 有 果 hx(y,z) = (人 xy,gxz)， 则 对 于 所 有 有 穷 列表 xs 有 


(foldr f a xs,foldr g b xs) = foldr h (a,b) xs 


一 个 复杂 的 问题 是 : 这 个 结果 对 于 所 有 的 列表 xs 成 立 吗 ? 
再 定义 一 个 函数 nh 使 得 
(foldl f a xs,foldl gb xs) = foldl h (a,b) xs 


习题 H 回顾 定义 : 


partition p xs = (filter p xs, filter (not . p) xs) 


请 将 两 个 分 量 表示 成 foldr 的 两 个 特例 。 由 此 利用 习题 G 的 结果 计算 partition 
的 男 一 个 定义 。 
定义 : 


part p xs us vs = (filter p xs ++ us, 
filter (not . p) xs ++ VS) 
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请 计算 partition 的 男 一 个 定义 ， 并 使 用 part 作为 局 部 定义 。 
习题 | 回顾 定义 : 


labels :: BinTree a -> [al 
labels (Leaf x) = [x] 
labels (Fork u v) = labels u ++ labels v 


计算 7T(labels)(n)， 其 中 n 是 树 中 叶 的 个 数 。 请 利用 累积 参数 技术 给 出 快速 计算 


labels 的 方法 。 
证 明 labels (build xs) = xs 对 于 所 有 有 穷 非 空 列表 成 立 。 
习题 」 定义 select k = (!! k) . sort， 其 中 sort 是 最 初 给 出 的 快速 排序 。 所 


以 ，select k 选择 非 空 有 穷 列表 中 第 上 最 小 元 素 。 第 0 最 小 元 素 是 最 小 的 元 素 ， 第 1 最 
小 元 素 是 下 一 个 最 小 元 素 ， 等 等 。 请 给 出 selcet 的 一 个 更 高 效 定义 ， 并 估算 其 运行 
时 间 。 


7.9 答案 
习题 A 答案 


sort [3.4 2] 
= insert 3 (sort [4,1,2]) 


insert 3 (insert 4 (insert 1 (insert 2 []))) 
insert 3 (insert 4 (insert 1 (2: 口 ))) 

insert 3 (insert 4 (1:2:[])) 

= insert 3 (1l:insert 4 (2:[])) 

= 1:insert 3 (insert 4 (2:[])) 


将 head . sort 应 用 于 长 度 为 n 的 列表 的 求 值 需 要 BB(n) 步 。 使 用 勤奋 求 值 大 约 需 
要 nw 步 。 对 于 ( 道 )， 答案 是 “是 的 "。 你 可 能 会 想 ， 我 们 定义 了 插入 排序 ,， 但是， 在 情 
性 求 值 策略 下 它 是 选择 排序 。 这 里 得 到 的 经 验 是 ， 在 惰性 求 值 策略 下 ， 事 情 并 不 总 是 我 们 
所 想象 的 那样 。 

习题 B 答案 对 于 第 一 部 分 ， 下 面 的 定义 满足 要 求 : 


length = foldl' (\n x -> n+1) 0 


对 于 第 二 部 分 ， 一 个 解 如 下 : 
length = length2 0 
length2 n [] = n 


length2 n (x:xs) = if n==0 then length2 1 xs 
else length2 (n+1) xs 


测试 na ==0 迫使 对 第 一 个 参数 求 值 。 
习题 C 答案 定义 fnx = if x==0 then undefined else0， 则 有 


foldl f 0 [0,2] =0 
foldl' f 0 [0,2] = undefined 


习题 D 答案 ”答案 是 ， 也许! 尽管 给 出 的 cp 定义 是 高 效 的 ， 但 是 ， 它 返回 列表 的 列 
表 元 素 的 排序 次 序 不 同 于 书 中 其 他 任何 定义 的 结果 。 如 果 只 关心 结果 的 集合 ， 那 么 次 序 关 
系 不 大 ， 但 是 对 那些 要 查找 一 个 满足 一 定性 质 的 列表 的 程序 ， 该 定义 对 程序 的 运行 时 间 和 
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结果 可 能 会 有 影 啊 。 
根据 融合 律 ， 必 须 定义 一 个 函数 使 得 
filter nondec (f xs yss) = g xs (filter nondec yss) 


其 中 fxsvss = [x:ys |x <- xs,ys < -yss]。 这 样 便 有 


filter nondec . cp 
= filter nondec . foldr f [[]] 


= foldr g [[]] 

现在 有 
nondec (x:ys) = null ys || (x <= head ys && nondec ys) 

由 此 得 到 
g xs [[]] = [[x] | x <- xs] 
g xs yss = [x:ys | x <- xs, ys <- yss, x <= head ys] 
习题 E 答案 ”对 于 第 一 部 分 ， 有 

T(2°) = 27(2™) + ©(2°) 


根据 归纳 法 ， 可 以 证 明 7(2 ) = py 9(2 ) 。 归 纳 步骤 如 下 : 


2》9(2…)+@(2 ) 


i=0 


省 


y Q(2) + OQ(2") 


>》 O(2") 
因此 ，7T(n) =@(k2*)。 现 在 假定 2 <n<2”** ， 那么 
z O(F2:) = T(2:) < T(rn) < 7T(2") = O((k +1)2") = OQ(12") 
所 以 ,，T(n) =@(12*) = O(nlogn)。 
习题 F 答案 定义 x <>n=n+l 以 及 n@ x =1+n, 则 有 


(x <> n) @ y= 1+(n+l) = (itn)+1 = x <> (n @y) 


第 二 个 证 明 类 似 。 
习题 G 答案 ”归纳 步骤 如 下 : 


(foldr f a (x:xs),foldr g b (x:xs) 
= (f x (foldr f a xs),g x (foldr g b xs)) 
= h x (foldr f a xs,foldr gb xs) 
= h x (foldr h (a,b) xs 
= foldr h (a,b) (x:xs) 


对 于 复杂 问题 的 回答 : 不 是 。 因 为 在 Haskell 中 (上 ， 上 ) 和 上 是 不 同 的 值 。 例 如 ， 
假设 定义 foo (x,y) = 1， 则 有 


foo undefined = undefined 
foo (undefined,undefined) = 1 


对 于 最 后 一 部 分 ， 定义 h 如 下 : 


各 
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hh (ys) ¥ = (ff ¥ XR ) 


习题 H 答案 我 们 有 filter p = foldr (op p) [] ， 其 中 : 
op Pp xX xs = if p x then x:xs else XS 
现在 有 


(op P X ys,op (not . p) x zs) 
= if p x then (x:ys,2zs) else (ys,x:zs) 


因此 ， 有 


partition p xs = foldr f ([],[]) xs 
Where f x (ys,2s) = if px 

then (x:ys,zs) 

else (ys,x:2Zs) 


对 最 后 一 个 问题 ， 有 


partition p xs = part p xs [] 口 

part p [] ys zs = (ys,zs) 

part p (x:xs) ys zs = if px 
then part p xs (x:ys) zs 
else part p xs ys (z:2zs) 


习题 | 答案” 记 着 7 表示 最 坏 情况 时 间 复 杂 度 。 对 于 labels 的 最 坏 情 况 是 树 的 每 要 
右 子 树 都 是 一 个 叶 。 因 此 ， 有 
T(labels)(n) = T(labels)(n -1) + O(n) 
其 中 (n) 表示 将 长 度 为 n -1 的 列表 与 长 度 为 1 的 列表 串联 的 运行 时 间 。 因 此 ， 有 
T(labels)(n) = 068()) = O(n ) 
使 用 累积 参数 方法 得 到 


labels t = labels2 t 口 
labels2 (Leaf x) xs = X:XS 
labels2 (Fork u v) xs = labels2 u (labels2 v xs) 


并 且 7T(1labels2)(n) =@(n)。 这 个 定义 将 labels 的 运行 时 间 由 二 次 方 改 进 为 线性 。 

对 于 证 明 labels (build xs) = xs， 其 中 的 归纳 假设 为 对 于 所 有 长 度 严格 小 于 xs 
长 度 的 列表 该 等 式 成 立 。 归 纳 步骤 如 下 : 

labels (build xs) 


= 1{ 设 xs 的 长 度 至 少 为 2 
并 令 (ys,zs) = halve xs} 


labels (Fork (build ys) (build zs)) 

= {labels 的 定义 } 

labels (build ys) ++ labels (build zs) 

= {归纳 假设 ， 因 为 ys 和 zs 的 长 度 严 格 小 于 xs 的 长 度 } 
ys ++ Zs 

= {halve xs 的 定义 } 


这 里 使 用 了 一 般 归 纳 (general induction ) 。 要 证 明 P (xs) 对 于 所 有 有 穷 列表 xs 成 立 ， 


只 要 证 明 : ( i ) P([]) 成 立 ; (二 ) 在 假设 性 质 P 对 于 所 有 长 度 严格 小 于 xs 长 度 列表 
成 立 的 前 提 下 ，P(xs) 也 成 立 。 


179 
: 


180 
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习题 J 答案 ”一 个 关键 性 质 是 

(xs ++ [x] ++ yYS)!Ik | k <n = XSlIk 
| k==n = Xx 
|k >n = ys!!(n-k) 
Where n = length xs 


为 一 个 关键 性 质 是 ， 对 一 个 列表 排序 不 改变 列表 的 长 度 。 因 此 ， 有 


select k [] = error "list too short" 
select k (x:xs) | k <1n = select k ys 
| k==n = Xx 


| otherwise = select (n-k) zs 
where ys = [y | y <- xs, y < x] 
2ZS = [z | z <- xs, XxX <= 2] 
n = length ys | 
对 于 长 度 为 n 的 列表 ， 最 坏 情 况 运 行 时 间 是 当 k=0 并 且 ys 的 长 度 为 n-1 时 ， 即 
x:xs 是 严格 递减 的 。 因 此 ， 有 
T(select)(0,n) = T(select)(0,n -1) +OQ(n) 
其 解 为 7T(select)(0, n) =@(n )。 但 是 ,假定 排序 结果 的 任何 排列 都 等 可 能 成 为 排序 
的 输入 ， 那 么 T( select)(k, n) =@(n)。 


7. 10 注 记 


算法 设计 方面 的 书 有 很 多 ， 不 过 有 两 本 书 关 注 于 函数 式 程序 设计 方面 的 算法 设计 : 由 
Fethi Rabbi 和 Guy Lapalme 编著 的 《A Functional Programming Approach》 ( second edition ) 
(Addison-Wesley，1999)， 以 及 由 我 编著 的 《Pearls of Functional Algorithm Design》 ( Cam- 
bridge, 2010 ) 。 

性 能 分 析 工 具 的 信息 包含 在 Haskell 平台 文档 中 。 排 序 算法 的 参考 资料 见 Don Knuth 的 
《The Art of Computer Programming, Volume 3 : Sorting and Searching》 (second edition ) ( Ad- 
dison-Wesley，1998 ) 。 
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将 去 打印 





本 章 介 绍 在 Haskell 中 如 何 构 建 一 个 小 函数 库 的 例子 。 库 是 由 一 些 特定 类 型 和 函数 构 
成 的 集合 ， 它 们 可 供用 户 完 成 某 种 任务 。 这 里 选择 的 任务 是 精美 打印 (pretty-printing)， 
即将 文本 用 多 行 显示 ， 使 得 内 容 更 容易 阅读 和 理解 。 这 里 将 忽略 许多 改进 可 阅读 性 的 特 


性 ， 如 颜色 或 者 字号 ， 而 只 是 将 关注 点 放 在 每 一 行 的 换行 位 置 以 及 缩 进 量 上 。 该 库 不 能 用 
于 数学 内 容 的 格式 布置 ， 但 是 可 以 帮助 展示 树 状 信息 ， 或 将 词 的 列表 显示 为 段落 。 
8.1 问题 背景 


首先 考虑 条 件 表达 式 的 显示 问题 。 本 书 使 用 了 三 种 方式 显示 这 种 表达 式 : 
if P then exprl else expr2 


if p then expril 
else expr2 


if p 
then exprl 
else expr2 


这 三 种 格式 分 别 占 用 一 行 、 两 行 和 三 行 ， 都 是 可 以 接受 的 ， 但 是 下 列 两 种 不 可 接受 : 
if P then 


exprl else expr2 

if p 

then exprl else expr2 

至 于 哪 种 格式 可 接受 、 哪 种 格式 不 可 接受 ， 这 是 由 作者 决定 的 。 用 户 或 许 不 同意 作者 
的 选择 (有 的 用 户 同意 ) ， 而 且 一 个 灵活 的 库 应 该 允许 用 户 自己 规定 可 接受 的 格式 。 总 之 ， 
有 两 个 问题 需要 回答 。 第 一 ， 如 何 描述 可 接受 的 格式 ， 拒 绝 不 可 接受 的 格式 ? 第 二 ， 如 何 
在 可 接受 的 格式 中 进行 选择 ? 

对 于 第 二 个 问题 的 简单 回答 是 ， 可 以 根据 所 允许 的 宽度 做 出 选择 。 例 如 ， 用 户 可 能 先 
择 占 最 少 行 的 格式 ， 条 件 是 每 行 能 够 在 给 定 的 宽度 内 显示 。 后 面 会 进一步 讨论 这 个 问题 。 

至 于 第 一 个 问题 ， 一 种 答案 是 写 出 所 有 可 接受 的 格式 。 这 需要 大 量 的 书写 工作 。 一 个 
更 好 的 方法 是 给 用 户 提供 一 种 适当 的 格式 描述 语言 (layout description language) 。 大 致 的 
想法 如 下 : 


if p <0> then exprl (<0> + <1>) else expr2 + 
if p <1> then exprli <1> else expr2 


其 中 <0 > 表示 一 个 空格 ，<1 > 表示 换行 ，+ 表示 “或 者 ”。 以 上 表达 式 可 以 生成 上 述 看 
到 的 三 种 可 接受 的 格式 。 但 是 ， 为 用 户 提 供 这 种 不 受 约束 的 选择 权 的 问题 是 ， 如 果 不 进 一 
步 查 看 每 个 选择 ， 就 很 难 决 定 最 好 的 格式 ， 而 查看 每 个 选择 需要 化 很 多 时 间 。 
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男 一 种 方法 是 让 用 户 只 能 使 用 一 个 函数 库 提供 的 某 些 函 数 和 运算 描述 格式 ， 因 此 只 人 允 
许 受 限制 的 格式 。 例 如 ， 考 虑 下 面 的 描述 : 


group (group (if p <1i> then expr1) <> <1> else expr2) 


其 中 group 在 一 组 格式 基础 上 填 加 男 一 组 格式 ， 它 将 一 组 格式 中 的 每 个 <1 > 用 <0 > 埠 
换 ， 由 此 使 得 每 个 格式 只 占 一 行 ，( < > ) 表示 将 串联 提升 到 格式 集合 的 连接 。 例 如 : 


group (if p <1> then expr1) 
= {if p <0> then expri, if p <1> then expr1} 


group (if p <1> then expr1) <> <1> else expr2 
= {if p <0> then expri <1> else expr2, 
if p <1> then exprl <1> else expr2} 
group (group (if p <1> then expr1) <> <1> else expr2) 
= {if p <0> then expri1 <0> else expr2, 
if p <0> then exprl <1> else expr2, 
if p <1> then exprl <1> else expr2} 


因此 ， 使 用 两 个 group 就 可 以 表达 以 上 三 种 可 接受 的 格式 。 
显示 条 件 表达 式 格 式 问题 还 有 另 一 个 方面 需要 考虑 。 如 果 expr1l 和 expr2 本 里 是 条 
件 表达 式 怎 么 办 ?或 许可 允许 如 下 的 格式 : 
和 if q 
then exprl 


else expr2 
else expr3 


关键 是 在 描述 语言 中 应 该 允许 缩 进 (indentation) 。 缩 进 指 每 个 换行 后 添加 适当 数目 的 
空格 。 这 个 想法 可 以 通过 一 个 函数 nest 实现 ， 使 得 nest i x 表示 在 格式 x 中 每 个 换行 
后 添加 i 个 空格 。 


8.2 文档 


为 了 统一 名 词 ， 把 表示 一 段 文 本 的 可 能 格式 集合 的 对 象 称 作文 档 ( document)。 文 档 
将 作为 稍 后 定义 的 类 型 Doc 的 元 素 。 为 一 方面 ， 一 种 格式 仅仅 是 一 个 串 : 

type Layout = String 

在 这 里 对 于 文档 到 底 是 什么 有 意 含糊 其 词 ， 因 为 今后 将 给 出 Doc 的 两 种 定义 。 目 前 
只 集中 考虑 格式 打印 库 应 该 提供 文档 上 的 哪些 运算 。 

第 一 个 运算 是 一 个 函数 : 

pretty :: Int -> Doc -> Layout 


其 参数 是 一 个 给 定 的 行 宽 和 一 个 文档 ， 返 回 最 好 的 格式 。 如 何 给 这 个 函数 一 个 高 效 的 定义 


正 是 本 章 的 主要 内 容 。 


layouts :: Doc -> [Layout] 


它 用 一 个 列表 返回 一 个 文档 的 可 能 格式 的 集合 。 为 什么 有 了 函数 pretty 还 需要 这 个 图 数 
呢 ? 原 因 是 ， 找 出 描述 用 户 认为 可 接受 的 格式 定义 需要 一 些 实验 。 实 验 的 方法 是 先 给 出 一 
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个 初始 定义 ， 然 后 通过 查看 定义 在 一 些 例子 上 的 结果 格式 再 对 定义 进行 修正 。 通 过 这 种 方 
法 ， 可 以 看 出 应 该 排除 哪些 格式 ， 应 该 添加 哪些 格式 。 所 以 ,无 论文 档 的 最 终 表 示 如 何 ， 
layouts 都 将 为 用 户 提 供 一 个 格式 诊断 工具 。 

剩余 的 运算 用 于 构建 文档 。 首 先是 将 两 个 文档 串联 成 一 个 新 文档 的 运算 : 

(<>) :22 Doc => Doc -=> Doc 

文档 串联 运算 显然 应 该 满足 结合 律 ， 所 以 对 任何 文档 x、y 和 z，< > 的 实现 应 满足 
下 面 等 式 ，: 

(x <> y) <> Z) = x <> (y <> Z) 

每 当 有 满足 结合 律 的 运算 时 ， 通常 需要 有 一 个 单位 元 ， 所 以 需要 提供 一 个 空 文档 : 

nil 3 Doc 
使 得 对 于 任意 文档 x, nil <>x=xX 和 x < > nil = 文成 立 。 

下 一 个 运算 是 函数 : 

text :: String -> Doc 
它 将 一 个 不 含 换行 伯 的 串 转 换 为 一 个 文档 。 为 了 提供 多 行 的 文档 ， 函 数 库 提供 男 一 个 基本 文档 : 

line :: Doc 

例如 : 

text "Hello" <> line <> text "World!" 
是 由 两 行 构成 的 单一 格式 文档 。 你 可 能 觉得 1ine 在 这 里 不 必要 ， 因 为 可 以 允许 在 文本 串 
中 加 入 换行 符 ， 但是， 如 果 将 一 个 文档 缩 进 ， 就 必须 查看 每 个 文本 的 内 容 。 更 好 的 方法 是 
提供 一 个 显 式 的 换行 文档 ， 这 样 就 可 以 选择 在 哪里 换行 了 。 

下 一 个 运算 是 提供 文档 向 套 的 函数 : 

nest :: lnt -> Doc -> Doc 
其 中 nest i 在 每 个 换行 后 面 插入 i 个 空格 ， 从 而 实现 文档 缩 进 。 需 要 强调 的 是 ， 缩 进 不 
是 在 文档 的 开始 位 置 完 成 的 ， 除 非 文档 以 换行 开始 。 后 面 将 解释 这 种 选择 的 原因 。 

最 后 ， 提 供 下 列 函 数 ， 从 而 完成 一 个 含 8 个 运算 的 格式 打印 库 : 

group :: Doc -> Doc 
这 是 提供 多 种 格式 的 函数 。 函 数 group 在 其 参数 文档 上 添加 一 个 额外 格式 ， 该 格式 不 含 
换行 ， 仅 由 一 个 文本 行 构 成 。 

表面 已 经 给 出 8 个 命名 的 运算 ， 并 给 出 它们 的 非 正 式 描述 ， 但是， 能 否 对 它们 满足 的 
性 质 以 及 它们 之 间 的 关系 给 出 更 精确 的 描述 呢 ? 更 基本 的 问题 是 ， 这 些 运 算是 否 足 够 灵 
活 ， 能 和 否 提供 一 组 合理 的 格式 。 

首先 考虑 我 们 而 望 什么 样 的 定律 成 立 ， 找 到 这 些 定律 能 够 增强 我 们 对 集成 工具 箱 的 信 
心 ， 相 信和 该 工具 箱 是 合理 的 、 自 然 的 集成 ， 而 且 没有 漏 掉 某 个 关键 的 工具 。 这 些 定律 也 会 
影响 运算 的 含义 ， 指 导 运 算 的 实现 。 前 面 已 经 断定 运算 ( < > ) 应 该 具有 单位 元 nil， 而 
且 满足 结合 律 ， 但 是 还 需要 其 他 定律 吗 ? 

是 的 ， 对 于 text 需要 下 面 性 质 成 立 : 


text (s ++ 七 ) = text s <> text 七 
Powe we = nil 
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用 数学 语言 来 说 ， 这 个 性 质 说 明 text 是 串 的 串联 运算 到 文档 串联 运算 的 同 态 。 对 于 
这 么 简单 的 事情 来 讲 ， 这 是 一 个 令 人 印象 次 刻 〈 也 许 同 时 令 人 生 晨 ) 的 名 词 。 注 意 ， 串 的 
串联 满足 结合 律 意味 着 文档 串联 也 满足 结合 律 ， 至 少 对 于 text 是 这 样 的 。 

对 于 nest ， 需 要 下 面 的 等 式 成 立 : 


nest i (x <> y) = nest i x <> nest iy 


nest i nil = nil 

nest i (text s) = text s 

nest i line = line <> text (replicate i ' ') 
nest i (nest j x) = nest (i+j) x 


nest 0 x a 区 

nest i (group X) = group (nest i X) 

所 有 这 些 等 式 (可 能 最 后 一 个 除外 ) 都 很 合理 ， 有 些 可 以 冠 以 数学 的 术语 (nest i 
对 于 串联 可 分 配 ，nest 是 数值 加 法 到 函数 复合 的 同 态 ， 并 且 nest i 与 group 可 交换 )。 
假如 nest 是 在 文档 的 开始 缩 进 ， 则 第 三 条 定律 不 成 立 ; 如 果 允 许 文 本 串 包含 换行 从， 这 
条 定律 也 不 成 立 。 最 后 一 条 定律 成 立 的 原因 是 分 组 添加 了 没有 换行 的 格式 ， 而 且 nest 对 
这 种 格式 没有 任何 影响 。 更 详细 的 说 明 参 见习 题 D。 

对 于 格式 的 性 质 ， 要 求 : 


layouts (x <> y) = layouts x <++> layouts y 
layouts nil i is 
layouts (text s) = [s] 
layouts line = ["\Nn"] 

layouts (nest i x) = map (nestl i) (layouts x) 
layouts (group x) = layouts (flatten x) ++ layouts x 


其 中 运算 ( < ++ > ) 是 提升 的 串联 : 


XSS <++> yss = [xs ++ ys | xs <- xss, ys <- yss] 


图 数 nestl :: Int -> Layout -> Layout 的 定义 如 下 : 


nestl] i = concat . map (indent i) 
indent i c = if c=='\n' then c:replicate i ' ' else [c] 


最 后 ，flatten :: Doc -> Doc 是 将 一 个 文档 中 的 换行 及 其 相关 的 缩 进 用 一 个 空格 代 
替 后 得 到 的 单一 格式 文档 。 该 函数 不 在 文档 库 的 公共 接口 中 出 现 ， 但 是 在 库 内 部 需要 用 到 该 
盟 数 。 完 成 代数 定律 的 描述 需要 该 郴 数 ， 可 以 说 在 这 个 意义 下 该 图 数 是 不 可 缺失 的 工具 。 
函数 flatten (局 平 化 ) 需要 满足 下 列 条 件 : 


flatten (x <> y) = flatten x <> flatten y 

flatten nil = 

flatten (text s) = text s 

flatten line = text " * 

flatten (nest i x) = flatten x 

flatten (group x) = flatten x 

现在 一 共有 24 条 定律 (关于 < >1 条 ; nil 和 text 各 2 条 ， 关 于 nest 有 7 条， 
layouts 和 flatten 各 6 条 )。 许 多 定律 看 起 来 像 包含 nil、text 等 构造 函数 的 数据 
类 型 上 的 Haskell 函数 定义 。 更 多 详情 参加 8.6 节 。 

8 个 运算 似乎 足 侨 ， 但 是 ， 这 些 运算 是 否 足 以 灵活 地 描述 用 户 想 要 的 格式 ? 布丁 做 得 
好 不 好 ， 尝 尝 才 知道 。 所 以 我们 马上 要 考虑 3 个 例子 。 在 此 之 前 ， 不 管 是 好 是 坏 ， 需 要 
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实现 文档 以 便 测试 这 些 例子 。 


8.3 一 种 直接 实现 
文档 表示 的 一 种 显然 选择 是 将 文档 等 同 于 它 的 格式 列表 : 


type Doc = [Layout] 


这 种 表示 称 为 浅 褒 入 (shallow embedding)。 对 于 浅 租 入 ， 库 函数 直接 用 相关 的 值 (这 里 
是 layouts) 实现 。 稍 后 我 们 将 舍弃 这 种 表示 ， 选 择 一 种 更 结构 化 的 方法 ,但 就 目前 来 
讲 ， 这 是 显然 的 尝试 。 

下 面 是 库 函 数 的 实现 (pretty 的 实现 稍 后 再 讲 ) : 


layouts = id 

X “> 了 = ZX <++> 本 

nil :el 

line = ["\n"] 

text s = [s] 

nest i = map (nestl i) 
group x = flatten x ++ x 


flatten x = [flattenl (head x)] 


我 们 已 经 定义 了 nestl，flattenl 的 定义 如 下 : 


flattenl :: Layout -> Layout 

flattenl [] = [0D 

flattenl (c:cs) 
| c=='\n' = ' ':flattenl] (dropWhile (== ' ') cs) 
| otherwise = c:flattenl cs 


这 个 实现 满足 前 面 的 24 条 定律 吗 ? 我 们 来 挨个 检查 一 遍 。 提 升 的 串联 <++> 具 有 单 
位 元 [[] ] ， 并 满足 结合 律 ， 所 以 前 3 条 定律 成 立 。 容 易 验 证 关于 text 的 两 条 定律 ， 关 
于 layouts 的 6 条 定律 也 显然 成 立 。 关 于 nest 的 定律 除 两 条 外 都 成 立 。 这 两 条 例外 是 


nest i . nest j = nest (i+j) 
nest i . group = group . nest i 


验证 它们 需要 下 一 点 功夫 〈 见 习题 C 和 习题 D) 。 剩 下 的 是 flatten， 其 中 3 条 容易 说 
明 ， 并 且 稍 花 点 时 间 就 可 以 证 明 〈 见 习题 下 和 习题 了 ) : 


flatten . nest i = flatten 
flatten . group = flatten 


但 困难 的 是 下 面 的 定律 : 


flatten (x <> y) = flatten x <> flatten y 


这 条 定律 不 成 立 。 如 果 取 x = line, y = text " hello"， 那 么 

flatten (x <> y) = ["hello"] 

flatten x <> flatten y = [" hello"] 
可 见 这 两 个 结 采 不 同 。 其 原因 是 flatten 去 除了 艇 套 的 影响 ， 但 是 如 果 在 非 峙 套 文档 中 
换行 后 有 空格 ，flatten 并 没有 删除 这 些 空格 。 男 一 方面 ，flattenl 删除 文档 中 每 个 
换行 后 的 空格 。 

我 们 不 准备 修正 这 个 缺陷 ， 而 是 接受 这 个 不 太 完 美的 实现 ， 继 续 向 前 。 可 以 证 明 ， 一 
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个 文档 的 所 有 格式 扁平 化 为 相同 的 串 〈 见 习题 王 答案 ) 。 浅 通信 还 有 另外 一 个 性 质 ， 稍 后 
在 pretty 的 定义 中 讨论 。 为 了 认识 这 个 性 质 ， 考 虑 返回 一 个 格式 的 形状 的 男 效 shape: 


shape :: Layout -> [Int] 
shape = map length . lines 


引导 库 函 数 1ines 将 一 个 串 在 换行 符 位 置 拆 分 ， 返回 没有 换行 符 的 串 的 列表 。 所 以 ， 
一 个 格式 的 形状 是 组 成 格式 的 行 的 长 度 列表 。Layouts 的 关键 性 质 是 一 个 文档 的 格式 形 
状 列表 是 按照 字典 序 递减 排列 的 。 例 如 ，8.4 节 中 描述 的 一 个 文档 有 13 种 可 能 的 格式 ， 其 
形状 如 下 : 

[[94] , [50 ,43] , [50 ,28 ,19] , [50 ,15 ,17 ,19] , [10 ,39 ,43] ， 

[10 ,39 ,28,19] , [10 ,39 ,15 ,17 ,19] , [10 ,28 ,15 ,43] ， 


[10,28,15,28,19] , [10 ,28,15,15,17,19] , [10,13,19,15,43], 
[10,13,19,15,28,19] , [10,13,19,15,15,17,19]] 


这 个 列表 是 按照 字典 序 递减 排列 的 。 这 个 性 质 成 立 的 原因 是 layouts (group x) 将 局 平 
化 的 格式 置 于 文档 x 的 格式 列表 的 前 面 ， 而 且 一 个 扁平 化 的 格式 只 有 一 行 。 更 多 细节 见习 
题 G。 


8.4 例子 


第 一 个 例子 是 处 理 条件 表 达 式 的 格式 。 就 目前 的 目的 ， 一 个 条 件 表达 式 可 以 表示 成 数 
据 类 型 cExpr 的 元 素 ， 其 中 : 


data CExpr = Expr String | If String CExpr CExpr 


下 面 的 消 数 cexpr 说 明 本 章 开 始 描述 的 可 接受 格式 : 
cexpr :: CExpr -> Doc 
cexpr (Expr p) = text p 
cexpr (If p x y) 
= group (group (text "if " <> text p “> 
line <> text "then " <> 
nest 5 (cexpr x)) <> 
line <> text "else " <> 
nest 5 (cexpr y)) 


这 个 定义 类 似 于 前 面 的 版 本 ， 只 是 子 表 达 式 的 骨 套 例外 。 
例如 ， 下 面 显示 一 个 特定 表达 式 的 13 种 可 能 格式 的 两 种 : 


if wealthy 
then if happy then lucky you else tough 
else if in love then content else miserable 
if wealthy 
then if happy 

then lucky you 

else tough 
else if in love 

then content 

else miserable 


从 最 后 一 个 表达 式 可 以 看 出 ， 为 什么 缩 进 量 选择 了 5 个 空格 。 这 个 特定 的 条 件 表达 式 
的 13 种 可 能 格式 的 形状 已 在 前 一 节 展 示 了 。 
第 二 个 例子 有 关 如 何 显示 一 般 的 树 ， 假 定子 树 数目 是 任意 的 : 
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data GenTree a = Node a [GenTree al 


下 面 是 一 个 树 的 例子 ,使 用 了 两 种 不 同 的 方式 显示 : 


Node 1 
[Node 2 
[Node 7 []， 
Node 8 []],， 
Node 3 
[Node 9 
[Node 10 [],， 
Node 11 []]], 
Node 4 [],， 
Node 5 
[Node 6 []]] 


Node 1 
[Node 2 [Node 7 [], Node 8 D]， 
Node 3 [Node 9 [Node 10 [], Node 11 []]], 
Node 4 [],， 
Node 5 [Node 6 []]] 


生成 这 些 树 ( 磁 蕊 ,以 上 格式 也 是 13 种 可 能 格式 的 两 种 ) 的 函数 gtree 定义 
如 下 : 


gtree :: Show a => GenTree a -> Doc 
gtree (Node x []) 
= text ("Node " ++ Show x ++ " []") 


gtree (Node x ts) 
= text ("Node " ++ Show x) <> 
group (nest 2 (line <> bracket ts)) 


定义 的 第 一 个 子 名 表示， 没有 子 树 的 树 总 是 单行 显示 ; 第 二 个 子 句 表示 ， 至 少 有 一 棵 子 树 
的 树 或 者 单行 显示 ,或 者 将 每 棵 子 树 显示 在 新 的 一 行 ， 并 缩 进 2 个 单位 。 函 数 bracket 
定义 如 下 : 


bracket :: Show a => [GenTree a] -> Doc 
bracket ts = text "[" <> nest 1 (gtrees ts) <> text "]" 


gtrees [t] = gtree t 
gtrees (t:ts) = gtree t <> text "," <> line <> gtrees ts 


老实 说 ， 给 出 以 上 定义 〈 对 该 定义 函数 layouts 是 不 可 或 缺 的 ) 花 了 一 点 时 间 和 实验 ， 
而 且 这 个 结果 一 定 不 是 显示 树 的 唯一 方法 。 

最 后 ， 这 里 展示 一 种 将 一 段 文本 (一 个 含 空格 和 换行 的 串 ， 不 是 文档 text ) 显示 为 
一 个 段落 的 方法 : 

para :: String -> Doc 


para = cvt . map text . words 


cvt [] = nil 
cvt (x:xs) 
= x <> foldr (<>) nil [group (line <> x) | x <- xs] 


首先 ， 使 用 标准 库 函 数 words 计算 文本 中 的 词 ， 该 函数 以 前 曾 多 次 见 到 ; 然后 ， 使 
用 text 将 每 个 词 转换 成 文档 ; 最 后 ， 除 第 一 个 词 外 ， 每 个 词 显 示 在 同一 行 或 者 新 的 一 
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行 。 如 果 文本 中 有 n+1 个 词 ， 因 此 有 个 分 隔 词 的 空格 ， 以 上 代码 描述 了 2 种 可 能 格 
式 。 在 计算 适合 给 定 行 宽 的 条 件 下 ， 我 们 当然 不 想 查 看 所 有 这 些 格式 。 


8.5 最 佳 格式 


如 上 所 述 ， 最 佳 格式 与 最 大 允许 行 宽 有 关 。 这 是 一 个 简单 的 决定 ， 但 不 是 唯一 的 决 
定 。 一 般 地 ， 一 个 嵌 套 文档 的 美观 格式 表现 为 一 条 文本 带 蚁 是 跨越 页 面 ， 而 且 有 理由 相信 
在 选择 最 好 格式 时 应 该 考虑 带 的 宽度 ， 即 一 行 中 除 缩 进 外 最 多 的 字符 数 。 总 之 ， 在 一 个 无 
穷 宽 的 页 面 上 的 最 好 格式 表现 为 所 有 文本 都 在 一 行 吗 ? 不过， 为 简单 起 见 ， 我 们 将 忽略 这 
个 非常 合理 的 改进 ， 只 把 行 宽 作 为 决定 因 系 。 

还 需要 做 出 男 外 一 个 决定 。 假 设 根据 某 个 标准 ， 在 所 有 满足 行 宽 要 求 的 格式 中 选择 最 
好 格式 。 如 果 至 少 存在 一 个 这 样 的 格式 ， 那 么 选择 没有 问题 ,但 是 假如 不 存在 怎么 办 ?两 
个 选择 是 ， 或 者 放弃 格式 化 过 程 ， 返 回 一 个 错误 信息 ， 或 者 尽 可 能 做 出 最 好 的 选择 ， 接 受 
行 宽 超出 限制 。 

从 心理 方面 和 实用 方面 讲 ， 第 二 个 选择 似乎 更 好 ， 所 以 我 们 将 探讨 这 个 选择 的 续 
果 。 下 面 从 比较 两 个 格式 的 第 一 行人 和 €; 开始 。 判 断 《1 比 《; 好 的 条 件 :( i ) 两 行 都 
在 行 宽 w 范围 内 ， 而 且 《 比 《长 ; (ii) 《1 满足 行 宽 要 求 ， 但 是 《, 不 满足 ; (了 讲 ) 两 
行 均 不 在 行 宽 w 范围 内 ， 而 且 《) 比 《{; 短 。 这 个 决定 是 合理 的 ， 因 为 这 个 方法 可 以 用 贪 
心 策 略 实现 : 在 不 超出 行 宽 的 条 件 下 尽 可 能 填 满 第 一 行 ; 如 果 不 可 行 ， 那 么 一 旦 超出 行 
党 立即 集 止 。 

在 两 行 长 度 相等 的 情况 下 ， 以 上 比较 测试 不 能 确定 下 一 步 如 何 进行 。 但 是 ， 因 为 所 有 
格式 届 平 化 为 同一 个 串 ， 如 果 第 一 行 长 度 相 等 ， 则 它们 是 同一 行 。 因 此 ， 第 一 行 已 经 确 
定 ， 接 着 比较 两 个 格式 的 第 二 行 ， 如 此 反复 下 去 。 

关于 形状 按照 字典 序 递 减 排列 的 性 质 也 可 用 于 简化 比较 测试 ， 因 为 如 果 在 格式 列表 中 
格式 lx 排 在 格式 ly 之 前 ， 那 么 lx 的 第 一 行 长 度 大 于 等 于 ly 第 一 行 的 长 度 。 如 果 这 两 行 长 
度 相等 ， 那 么 前 一 陈述 句 对 第 二 行 以 及 以 后 各 行 都 是 成 立 的 。 

对 于 以 上 给 出 的 文档 浅 舱 入， 下 面 是 查找 最 优 格式 函数 pretty 的 一 个 简单 实现 ; 

pretty :: Int -> Doc -> Layout 

pretty w = fst . foldri choose . map augment 

nto lx = (lx,shape 1x) 


choose alx aly 
= if better (snd alx) (snd aly) then alx else aly 


better [] ks = True 
better js [] = False 
better (j:js) (k:ks) | j == k = better js ks 


| otherwise = (j “= WwW) 


每 种 格式 附 上 其 形状 信息 用 于 指引 格式 的 选择 ， 这 可 用 一 个 简单 查找 来 完成 。 测 试 卫 
数 better 实现 以 上 描述 的 比较 运算 。 最 后 ， 形 状 信息 被 丢弃 。 

图 数 pretty 的 这 个 定义 是 极度 低 效 的 ， 因 为 它 要 计算 和 查看 每 种 格式 。 假 如 对 
于 是 否 换行 有 n 种 可 能 的 选择 ， 那 么 需要 检查 2" 种 格式 ，pretty 的 运行 将 会 极其 
慢 。 例 如 : 
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ghci> putStrLn $ pretty 30 $ para pg 

This is a fairly short 

paragraph with just twenty-two 

words. The problem is that 

pretty-~printing it takes time, 

in fact 31.32 seconds. 

(31.32 secs, 17650013284 bytes) 
天 哪 ! 更 糟 的 是 ， 格 式 打印 更 长 的 段落 会 使 得 CHCi 骨 江 ,给 出 信息 “内 存 耗 尽 ”。 任 何 
指数 时 间 和 空间 的 算法 都 是 不 可 接受 的 。 

需要 pretty 算法 最 多 查看 w 个 字符 便 可 确定 第 一 行 的 选择 。 算 法 还 应 该 是 有 效 的 ， 
运行 时 间 对 于 所 处 理 文 档 大 小 是 线性 的 。 理 想 情况 下 运行 时 间 不 应 该 依赖 于 w， 但 是 如 果 
更 快 的 算法 也 意味 着 更 复杂 的 程序 ， 那 么 运算 时 间 依 赖 于 w 也 是 可 接受 的 。 


8.6 项 表示 


将 文档 等 同 于 它 的 可 能 格式 列表 的 问题 是 结构 信息 的 丢失 。 实 际 上 将 这 个 所 有 可 能 格 
式 的 列表 隐藏 得 越 深 越 好 ， 而 不 应 该 把 它 提 到 最 项 层 。 例 如 ， 考 虑 一 个 文档 的 以 下 两 种 表 
达 式 : 
A<O0>B<0>D + A<O0>B<1>D + A<1>C<0>E + A<1>C<1>E 
A(<0>B(<0>D + <1>D) + <1>C(<O>E + <1>E)) 
同 前 一 样 ，<0 > 表示 单个 空格 ，<1 > 表示 一 个 换行 。 其 中 5 个 字母 表示 5 个 非 空 文 
本 。 因 为 所 有 4 种 方法 必须 局 平 化 为 同一 个 文档 ， 故 要 求 B<0 >D = C <0 >E。 在 第 
一 个 表达 式 (基本 上 是 用 格式 列表 来 表示 文档 ) 中 有 4 个 格式 需要 比较 。 在 第 二 个 式 子 
中 比较 可 以 简化 。 例 如 ， 如 果 已 知 公共 前 级 A 超过 给 定 的 行 宽 ， 那 么 前 两 个 格式 可 以 舍 
奔 ， 无 需 进一步 的 比较 。 更 进一步 ， 如 果 从 最 内 到 最 外 选择 ， 只 需 比 较 格 式 的 第 一 行 即 
可 。 例 如 ， 如 果 首 先 在 C<0 >E 和 Cc<1 >E 之 间 选 择 较 好 的 ， 那么 这 个 选择 不 会 被 以 
后 的 选择 更 改 。 
维护 文档 结构 的 方法 是 把 文档 表达 成 一 棵 树 : 
data Doc = Nil 
| Line 
| Text String 
| Nest Int Doc 


| Group Doc 
| Doc :<>: Doc 


注意 最 后 一 行使 用 了 中 组 构造 函数 。Haskell 允许 中 缀 运算 符 作 为 构造 函数 ,但 必须 用 冒 
号 开始 。 结 尾 不 必 也 用 冒号 ,但 是 用 冒号 结尾 显得 更 自然 。 这 种 树 称 为 抽象 语法 树 (ab- 
stract syntax tree) ， 打 印 库 的 每 个 运算 用 一 个 构造 函数 表示 。 使 用 抽象 语法 树 的 实现 便 是 
所 谓 的 深 上 入 (deep embedding ) 。 

打印 库 将 为 用 户 只 提供 数据 类 型 Doc 的 名 ,不 提供 其 他 细节 。 为 了 说 明 这 样 做 的 原 
因 ， 这 里 有 必要 就 Haskell 数据 类 型 为 外 做 一 点 说 明 。 在 Haskell 中 数据 声明 的 作用 是 引入 
一 个 新 的 数据 类 型 ， 方 法 是 说 明 这 个 类 型 的 值 是 如 何 构造 的 。 每 个 值 可 以 用 仅 由 数据 类 型 
的 构造 消 数 构建 的 表达 式 命名 ， 换 句 话 说 ， 每 个 值 可 用 一 个 项 (term) 表示 。 而 且 ， 不同 
的 项 表示 不 同 的 值 (只 要 不 存在 严格 标志 )。 数 据 类 型 上 的 函数 可 以 用 构造 函数 上 的 模式 
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匹配 定义 。 因 此 ， 无 需 说 明 数 据 类 型 上 的 运算 是 什么 ， 只 需 给 出 定义 即 可 。 如 末 只 摘 述 藉 
型 的 值 ， 不 描述 类 型 的 运算 ， 这样 的 类 型 称 为 具体 类 型 (concrete type) 。 

这 种 情况 正好 和 抽象 (abstract) 数据 类 型 相反 。 对 于 抽象 数据 类 型 ,运算 被 命名 ， 
但 是 对 如 何 构 造 类 型 的 值 不 做 说 明 ， 至 少 没有 公开 给 用 户 。 例 如 ，Float 是 抽象 数据 类 
型 ， 该 类 型 提供 了 基本 算术 运算 和 比较 运算 的 名 ， 以 及 如 何 显示 浮 点 数 ， 但 是 并 没有 说 明 
这 些 数 是 如 何 实际 表示 的 。 用 户 不 可 以 用 模式 匹配 的 方法 定义 浮 点 数 上 的 函数 ， 只 能 用 给 
定 的 运算 定义 其 他 函数 。 可 以 而 且 应 该 公开 给 用 户 的 是 这 些 运 算 的 实际 含义 和 代数 性 质 。 
不 过 ，Haskell 只 提供 非 正式 的 注释 ,没有 其 他 的 说 明 方法 。 

如 Doc 所 示 ， 它 是 一 个 具体 类 型 。 但 就 我 们 对 该 类 型 的 理解 ， 不 同 的 项 并 不 表示 不 
同 的 值 。 例 如 ， 每 个 构造 函数 的 原意 是 代 蔡 相应 的 运算 。 因 此 ， 有 

me 

text s = Text s 

nest i x = Nest i x 

group X = Group x 

x <>Yy = 次 3 交 

这 些 运算 的 代数 性 质 也 应 该 保持 ， 如 下 面 的 等 式 应 该 成 立 : 

+ 中 TX) 9 

Nest i (Nest j x) = Nest (i+j) x 
但 是 这 些 等 式 当然 不 成 立 。 解 决 问题 的 方法 是 利用 模块 结构 把 Doc 的 构造 函数 对 用 户 隐 
藏 起 来 ， 而 且 只 认为 这 些 定律 是 “观察 上 ”正确 的 。 例 如 ， 要 求 


layouts ((x :<>: y) :<>: Z) = layouts (x :<>: (y :<>: 2z)) 


观察 文档 的 唯一 方法 是 通过 layouts。 从 用 户 的 角度 看 ， 如 果 两 个 文档 生成 同一 个 格式 ， 
那么 它们 基本 上 是 相同 的 文档 。 

现在 返回 到 程序 设计 上 来 。 下 面 是 layouts 的 一 种 定义 。 该 定义 是 先前 看 到 的 lay- 
outs 满足 的 定律 ， 只 是 现在 表达 成 了 适当 的 Haskell 定义 : 


layouts :: Doc -> [Layout] 
layouts (x :<>: y) = layouts x <++> layouts y 


layouts Nil 本 
layouts Line = ["\n"] 
layouts (Text s) = [sj 


layouts (Nest i x) = map (nestl i) (layouts x) 
layouts (Group x) = layouts (flatten x) ++ layouts x 


图 数 flatten 的 定义 类 似 : 


flatten :: Doc -> Doc 

flatten (x :<>: y) = flatten x :<>: flatten y 
flatten Nil = Nil 

flatten Line = Text " " 

flatten (Text s) = Text s 

flatten (Nest i x) = flatten x 

flatten (Group x) = flatten x 


对 于 这 些 定义 ，24 条 定律 或 者 按照 定义 成 立 ， 或 者 在 以 上 所 述 意 义 下 观察 正确 。 
函数 layouts 的 定义 非常 简单 ， 但 是 也 包含 不 必要 的 低 效 。 这 里 给 出 两 个 独立 的 理 
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由 说 明 造 成 问题 的 原因 。 首 先 ， 考 虑 函数 egotist 的 定义 : 

egotist :: Int -> Doc 

egotist n | n==0 = nil 

| otherwise = egotist (n-1) <> text "me" 

文档 egotist n 是 非常 枯燥 的 ， 而 且 它 的 唯一 格式 是 由 n 个 重复 的 me 构成 的 串 。 
顺便 说 明 的 是 ， 可 以 使 用 Nil、(: < > :) 和 Text 来 给 出 定义 , 但是， 如 前 所 讲 ， 这些 构 
造 晴 数 对 用 户 不 是 公开 的 。 di 情况 ，egotist 可 能 是 打印 库 的 用 户 定义 的 。 总 之 ， 
再 返回 讨论 的 问题 ， 运 算 ( 是 左 结合 的 ， 这 使 得 计算 它 的 格式 需要 B(n ) 步 。 运 算 
( ++ ) 被 堆积 到 左面 。 这 种 pe concat 用 foldl 定义 比 用 foldr 定义 效率 
低 一 个 级 别 。 

低 效 的 第 二 个 来 源 与 骨 套 有 关 。 例 如 ， 考 虑 如 下 定义 的 函数 egoi st: 

egoist :: Int -> Doc 

egoist n | n==0 = nil 

| otherwise = nest 1 (text "me'" <> egoist (n-1)) 

定义 中 看 不 到 换行 ， 所 以 egoist n 与 egotist n 表示 同一 个 枯燥 的 文档 。 但 是 ， 尽 管 
串联 是 右 结 全 的， 构造 格式 仍然 需要 二 次 方 的 运行 时 间 。 因 为 每 个 腾 套 运算 需要 穿 过 整个 
文档 才能 完成 。 试 试看 。 

解决 第 一 个 问题 的 方法 是 延迟 串联 ， 将 一 个 串联 的 文档 用 其 成 分 文档 的 列表 表示 。 解 
决 第 二 个 问题 的 方法 是 延迟 舱 套 ， 舱 套 文档 用 必要 的 缩 进 量 和 文档 的 二 元 组 来 表示 。 结 合 
这 两 种 解决 方法 ， 一 个 文档 表示 为 缩 进 量 和 文档 的 二 元 组 列表 。 特 别 地 ， 考 虑 以 下 定义 的 
靖 数 toDoc: 


toDoc :: [(Int,Doc)] -> Doc 
toDoc ids = foldr (:<>:) Nil [Nest i x | (i,x) <- ids] 


现在 可 以 给 出 隐 数 layr 的 定义 : 


layr = layouts . toDoc 


然后 基于 layr 给 出 layouts 的 新 定义 。 该 定义 细节 留 作 练习 ， 这 里 只 给 出 续 果 : 


layouts x = layr [(0,x)] 


layr [] 3 [LE] 

layr ((i,x :<>: y):ids) = layr ((i,x):(i,y):ids) 

layr ((i,Nil):ids) = layr ids 

layr ((i,Line):ids) = ['\n':replicate i ' ' ++ 1s 
| 1s <- layr ids] 

layr ((i,Text s):ids) = [s ++ ls | ls <- layr ids] 


layr ((i,Nest j x):ids) = layr ((i+j,x):ids) 
layr ((i,Group x):ids) = layr ((i,flatten x):ids) ++ 
layr ((i,x):ids) 


这 个 定义 对 每 个 格式 的 运行 时 间 是 线性 的 。 同 样 的 模板 用 于 选择 单个 最 优 格 式 也 
数 pretty: 

pretty w x = best w [(0,x)] 

where 


best r [] a 
best r ((i,x :<>: y):ids) = best r ((i,x):(i,y):ids) 
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best r ((i,Nil):ids) = best r ids 

best TY ((i,Line):ids) = '\n':replicate i ' ' ++ 
best (w-i) ids 

best r ((i,Text s):ids) = s ++ best (r-length s) ids 


best r ((i,Nest j x):ids) = best r ((i+j,x):ids) 
best r ((i,Group x):ids) = better r 
(best r ((i,flatten x):ids)) 
(best r ((i,x):ids)) 
困 数 best 的 第 一 个 参数 是 当前 行 剩余 可 用 空间 。 该 函数 局 部 于 函数 pretty 的 定义 以 避 
免 best 附带 最 大 行 宽 作 为 额外 参数 。 
剩 下 的 问题 是 计算 petter r 1x 1y。 可 以 利用 1x 的 第 一 行 长 度 一 定 不 小 于 1y 的 第 
一 行 长 度 的 事实 。 因 此 ， 只 要 比较 1x 第 一 行 长 度 与 工 的 大 小 即 可 。 如 果 前 者 小 于 等 于 后 
者 ， 则 选择 1x， 和 否则 选择 ly。 因 此 可 以 定义 : 


better r lx ly = if fits r lx then lx else ly 


但 是 ,我 们 不 希望 计算 1x 第 一 行 整 行 长度 ， 因 为 这 样 查看 得 太 多 。 一 种 节俭 的 方 
法 是 


fits r _. | r<0 = False 
生生 起 人 于 1 = True 
fits r (c:cs) = if c == '\n' then True 


else fits (r-1) cs 


基于 同样 的 原因 ，better 的 第 二 个 和 第 三 个 参数 使 用 惰性 计算 策略 是 很 重要 的 ， 也 
网 是 说 ， 两 种 格式 的 求 值 只 需 能 够 确定 哪个 更 好 即 可 ， 不 需要 计算 更 多 。 
再 回 过 来 看 看 有 问题 的 段落 : 


ghci> putStrLn $ pretty 30 $ para pg 
This is a fairly Short 

paragraph with just twenty-two 
words. The problem is that 
pretty-printing it takes time, 

in fact 31.32 seconds. 

(0.00 secs, 1602992 bytes) 


现在 看 起 来 好 多 了 。 习 题 工 讨论 pretty 的 运行 时 间 。 
最 后 一 个 任务 是 将 这 个 小 函数 库 组 织 成 一 个 模块 。 下 面 是 主要 的 声明 部 分 : 
module Pretty 
(Doc, Layout, 
nil, line, text, 
nest, (<>), group, 
layouts, pretty, layout) where 
模块 名 是 Pretty， 而 且 包 含 这 些 声 明和 库 函 数 定义 的 文件 必须 命名 为 Pretty .1hs。 
Pretty 模块 输出 11 个 对 象 。 首 先是 抽象 数据 类 型 的 名 Doc ， 该 类 型 的 构造 函数 没有 输 
出 。( 顺 便 指出 ， 如 果 确 实 想 输出 所 有 的 构造 函数 ， 那 么 在 输出 列表 中 需要 写 Doc (..); 
如 果 只 需要 输出 部 分 构造 函数 ， 如 Nil 和 Text ， 则 需要 写成 Doc (Nil, Text )。) 然后 
是 名 Layout ， 它 是 String 的 同义词 。 接 下 来 是 上 面 定义 的 8 个 常量 和 函数 。 最 后 的 函 
数 layout 用 于 打印 输出 格式 : 
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layout :: Layout -> I0 () 
layout = PutStILn 


现在 格式 打印 库 构 建 守 成 了 。 当 然 ， 对 于 一 个 真正 实用 的 库 ， 还 需要 另外 提供 一 些 组 
合 函 数 。 例 如 ， 可 以 提供 : 


(<+>), (<|>) :: Doc -> Doc -> Doc 
x > ym <> tort " "Ky 
x <|> y= XxX <> line <>y 


spread,stack :: [Doc] -> Doc 


spread = foldr (<+>) nil 
stack = foldr (<|>) nil 


读者 无 疑 可 以 想 出 许多 其 他 的 组 全 函数 。 


8.7 习题 
习题 A 该 库 的 一 个 挑剔 用 户 只 想 要 某 个 文档 的 3 种 格式 : 
ABC AB A 


C BC 


该 用 户 能 用 库 中 输出 的 函数 完成 这 个 任务 吗 ? 

习题 B 一 个 文档 的 格式 用 一 个 列表 给 出 。 但 是 它们 都 各 不 相同 吗 ? 请 给 出 证 明 ， 或 
者 给 出 有 反例。 为 外 ， 由 定律 是 否 可 以 明显 地 看 出 每 个 文档 有 一 组 非 空 的 格式 集 。 

习题 C” 接 下 来 的 4 个 习题 涉及 8.3 节 的 浅 租 和 信 。 用 等 式 推 理 证明 : 


nest i . nest j = nest (i + j) 


这 里 可 能 需要 有 关 nest1 的 辅助 性 质 ， 但 是 不 必 证 明 。 
习题 D ”接着 习题 C， 用 等 式 推 理 (在 点 层 ) 证 明 : 


nest i (group X) = group (nest i x) 


这 里 同样 需要 一 个 辅助 结果 。 

习题 E 接 前 习题 D, 证 明 flatten . group = flatten。 这 里 也 需要 一 个 辅助 
结果 。 

习题 F 最 后 一 个 定律 是 flatten . nest i = flatten。 猜 对 了 ， 这 里 也 需要 一 
个 辅助 结果 。 

习题 G 前 面 曾 讲 过 ， 引 导 库 函数 lines 将 一 个 串 按 照 换 行 符 分 成 多 个 串 。 实 际 上 ， 
lines 把 换行 符 看 作 终 止 字 符 ， 所 以 lines"hello" 和 1lines"hello mn" 返回 相同 的 
结果 。 一 个 更 好 的 定义 是 将 换行 符 看 作 分 隔 符 (separator)， 这 是 有 道理 的 ， 这 样 一 来 ， 
行 数 总 是 比 换行 符 多 1。 请 定义 这 样 的 图 数 1ines ， 以 下 将 需要 这 个 新 的 定义 。 

现在 可 以 按 下 列 步 又 证 明 : 将 map shape 应 用 于 一 个 文档 的 格式 返回 一 个 按照 字典 
序 逆 序 排列 的 整数 序列 。 首 先 ， 定义: 

msl = map shape . layouts 

shape = map length . lines 
其 中 1ines 是 以 上 重 写 定义 的 函数 。 需 要 证 明 msl 在 任何 文档 上 返回 一 个 递减 序列 。 为 
此 ， 需 要 定义 函数 nesty 和 groupy 使 得 
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nesty i . msl = msl . nest i 
groupy . msl = msl] . group 


男 外 定义 运算 <+> 使 得 

msl x <+> msl y = msl (x “> y) 
( 正 是 这 个 等 式 需要 1ines 的 新 定义 。) 最 后 证 明 如 果 xs 和 ys 是 递减 的 ， 那么 nesty i 
xs 和 groupy xs 以 及 xs < + > ys 都 是 递减 的 ， 由 此 完成 证 明 。 不 过 ， 本 题 只 要 求 给 
出 nesty、groupy 和 < + > 的 定义 。 

习题 H 定义 一 个 函数 doc :: Doc -> Doc， 该 函 数 描述 如 何 设置 Doc 元 素 的 格 
式 ， 其 中 Doc 是 8.6 节 的 抽象 语法 树 表示 。 

习题 | 考虑 一 个 函数 prettybad,， 该 函数 从 列表 layouts 中 选择 一 个 最 好 格式 ， 
其 方法 是 选取 所 有 行 都 适合 给 定 行 宽 的 第 一 个 格式 ， 如 果 不 可 行 ， 则 取 最 后 一 个 。 
Prettybad 是 否 总 是 计算 出 与 pretty 相同 的 结果 ? (提示 : 考虑 文章 的 段落 。) 

习题 」 使 用 Doc 构造 函数 的 代数 性 质 ， 计 算 layouts 的 高 效 定义 。 

习题 K ”所 设计 的 pretty w 是 最 优 的 选择 ， 也 就 是 说 ， 如 有 可 能 ， 则 选择 断 行 避免 
行 超出 给 定 行 宽 。pzretty w 还 是 有 界 的 ， 也 就 是 说 ， 无 需 查 看 输入 的 w 字符 即 可 选择 下 
一 行 的 断 行 位 置 。 根 据 这 些 条 件 ， 判 断 下 列 GHCi 命令 的 输出 是 什么 ? 


layout $ pretty 5 $ para pg 
layout $ pretty 10 $ cexpr ce 


其 中 


pg = "Hello World!" ++ undefined 
ce = If "happy" (Expr "great") undefined 


习题 L 没有 文档 规模 的 定义 就 难以 将 pretty w x 用 x 表达。 下 面 是 一 个 合理 的 规 


模 定 义 : 
size :: Doc -> Int 
size Nil = 1 
size Line = 1 
size (Text s) = 1 
size (Nest i x) = 1 + size x 
size (x :<>: y) = 1 + size x + size y 
size (Group x) = 1+ size x 
按照 这 个 定义 ， 以 下 两 个 文档 的 规模 都 是 2。 
nest 20 (line <> text "!") 


nest 40 (line <> text "!") 


但 是 ， 生 成 第 二 个 格式 的 时 间 是 生成 第 一 个 的 2 倍 ， 所 以 pretty 的 代价 不 可 能 是 文 
档 规模 的 线性 函数 。 
替代 pretty 生成 最 后 格式 即 一 个 串 的 方法 是 ， 引 入 一 个 表示 格式 的 数据 类 型 


data Layout = Empty 
| String String Layout 
| Break Int Layout 


并 定义 layout :: Layout -> String 如 下 : 
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layout Empty 
layout (String s x) 
layout (Break i x) 


则 有 下 列 等 式 : 


Pretty w = layout . prettyl w 


其 中 新 的 函数 pretty1l 生成 一 个 Layout ， 而 不 是 一 个 串 。 请 定义 prettyl。 
一 个 更 合理 的 问题 是 ，prettyl w x 是 否 关 于 x 是 线性 的 ? 


Ss ++ layout x 
'\n':replicate i ' ' ++ layout x 


8.8 答案 


习题 A 答案 不 能 。 不 可 能 允许 A<0>B<1>C 和 A<l>B<0 >C 而 不 允许 
A<0>B<0> 和 A<1>B<1>Cc。 这 4 种 格式 由 下 式 给 出 : 
group (A <> line <> B) <> group (line <> C) 


习题 B 答案 一 个 文档 的 格式 不 一 定 都 不 一 样 。 例 如 : 


layouts (group (text "hello")) = ["hello","hello"] 


是 的 ， 显然 每 个 文档 都 有 一 个 非 空 格式 集 。 观 察 有 关 layouts 的 定律 ， 基 本 文档 有 
一 个 非 空格 式 列表 ， 而 且 这 个 性 质 在 其 他 运算 下 保持 不 变 。 

习题 C 答案 计算 过 程 如 下 : 

nest i . nest j 

= {nest 的 定义 } 

map (nestl] i) . map (nest] j) 

= {map 的 函 子 律 } 

map (nestl] i . nestl] j) 

= {辅助 性 质 } 

map (nestl] (i+j)) 

= {nest 的 定义 } 

nest (i+j) 


辅助 性 质 是 nestl i . nestlj = nestl (i +j)， 可 以 根据 下 列 等 式 做 简单 计算 : 


indent (i+j) = concat . map (indent i) . indent j 


其 证 明 省 略 。 203 | 
习题 D 答案 ”推理 如 下 : 


nest i (group Xx) 
= {group 的 定义 } 
nest i (flatten x ++ XxX) 
= {因为 nest i = map (nestl i)} 
nest i (flatten x) ++ nest i x 
= {辅助 性 质 } 
flatten (nest i x) ++ nest i x 
= {group 的 定义 } 
group (nest i x) 


震 妥 的 辅助 性 质 为 
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nest i . flatten 
= {因为 flatten x 中 不 含 换行 } 
flatten 
= {因为 flatten . nest i = flatten (习题 F)} 


flatten . nest i 


习题 E 答案 ”推理 如 下 : 
flatten . group 
= {flatten 和 group 的 定义 } 
one . flattenl . flattenl . head 
= {辅助 性 质 } 
one . flattenl . head 
= {flatten 的 定义 } 
flatten 


辅助 性 质 是 flattenl 满足 乔 等 律 : 


flattenl . flattenl = flattenl 


这 是 因为 flattenl 返回 不 含 换行 的 格式 。 
另外 ， 正 是 ElLattenl 的 磊 等 律 保证 一 个 文档 扁平 化 为 同一 个 串 。 唯 一 引入 多 个 格 
式 的 函数 是 group， 其 定义 为 


group x = flatten x 十 + Xx 


因此 ， 必 须 证 明 对 列表 的 第 一 个 元 系 局 平 化 后 得 到 的 串 等 于 对 第 二 个 元 系 届 平 化 后 得 
到 的 串 。 故 需 要 证 明 : 


flattenl . head . flatten = flattenl . head 


这 个 等 式 可 以 用 flatten 的 定义 和 函数 flattenl 的 寡 等 律 推出 。 
习题 F 答案 推理 如 下 : 

flatten . nest i 
“ 江汉} 

one . flattenl . head . map (nestl i) 
= {因为 head . map f =f . head} 

one . flattenl . nestl i . head 
= {辅助 性 质 } 

one . flattenl . head 
= {flatten 的 定义 } 

flatten 


需要 的 辅助 性 质 是 flattenl . nestl i = flattenl。 
习题 G 答案 ”可 以 定义 : 


lines xs = if null zs then [ys] 
else ys:lines (tail zs) 
Where (ys,2Zs) = break (=='\n') xs 


疯 数 groupy 定义 如 下 : 


groupy :: [[Int]] -> [[Int]] 
groupy (xs:XSS) = [sum xs + length xs - 1]:xs:xss 
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靖 数 nesty 定义 如 下 : 


Besty :7 :i Tnt -> [Lintj] -> LLrxt]] 
nesty i = map (add i) 
Where add i (x:xs) = x:[i+x | x <- xs] 


晴 数 ( < + > ) 定 义 如 下 : 


(< :3 [Eat]] => Lo => LLlint)j] 
xss <+> yss = [glue xs ys | xs <- xss, ys <- yss] 
Where glue xs ys = init xs ++ [last xs + head ys] ++ 


tail ys 
习题 H 答案 ”一 种 定义 如 下 ， 当 然 可 以 对 其 改进 : 
doc :: Doc -> Doc 
doc Nil = text "Nil" 
doc Line text "Line" 


doc (Text s) 
doc (Nest i x) 


text ("Text " ++ Show S) 
text ("Nest " ++ show i) <> 
group (nest 2 (line <> paren (doc x))) 
doc (x > y) = oC RLY tort * v3 < 
group (line <> nest 3 (doc y)) 
doc (Group x) = text "Group " <> 
group (nest 2 (line <> paren (doc Xx))) 


paren X = text "(" <> nest 1 x <> text ")" 


习题 | 答案 不 是 。 考 虑 这 样 的 段落 ， 其 中 最 长 的 词 比 行 宽 多 一 个 字符 。prettybad 
将 把 每 个 词 放 在 单独 一 行 ， 而 pretty 仍然 可 以 将 段落 中 适合 行 宽 的 一 组 词 填 和 人 一行。 
例如 : 


ghci> putStrLn $ pretty 11 $ para pg4 


A lost and 

lonely 

hippopotamus 

went into a 

bar. 206 


习题 J 答案 首先 证 明 layouts x = layr [(0,x)]: 
layr [(0,x)] 

= {layr 的 定义 } 

layouts (toDoc [(0,x)]) 

= {toDoc 的 定义 } 

layouts (Nest 0 x :<>: Nil) 

= {有 关 Doc 的 定律 } 


layouts x 


仍然 需要 给 出 layr 的 归纳 定义 。 这 里 只 给 出 两 个 子 句 : 


toDoc ((i,Nest j x) :ids) 


= {toDoc 的 定义 } 

Nest i (Nest j x) :<>: toDoc ids 
= {定律 } 

Nest (i+j) x :<>: toDoc ids 
= {toDoc 的 定义 } 


toDoc ((i+j Xx):ids) 
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所 以 有 layr ((i,Nest jx):ids) = layr (( +jx):idas)。 然 后 有 

toDoc ((1,%:<>Yy):1de) 

= {toDoc 的 定义 } 
Nest i (x :<>: y) <> toDoc ids 

{定律 } 

Nest i x :<>: Nest i y :<>: toDoc ids 

= {toDoc 的 定义 } 
toDoc ((i,x):(i,y):ids) 


因 下 WTaver (ti ylides laywre 是 位) 
习题 K 答案 


ghci> layout $ pretty 5 $ para pg 
Hello 
207 Worldi*** Exception: Prelude.undefined 


ghci> layout $ pretty 10 $ cexpr ce 
if happy 

then great 

else *** Exception: Prelude.undefined 


习题 L 答案 ”图 数 prettyl 的 定义 是 


prettyl :: Int -> Doc -> Layout 
prettyl Ww x = best w [(0,x)] 
where 
best 工 
best r ((i,Nil):ids) 
best r ((i,Line):ids) 
best TY ((i,Text s):ids) 
r 
r 
r 


品 Empty 

best r ids 

Break i (best (w-i) ids) 

String s (best (r-length s) ids) 

best r ((i+j,x):ids) 

best r ((i,x):(i,y):ids) 

better r 
(best r ((i,flatten x):ids)) 
(best r ((i,x):ids)) 


best ((i,Nest j x):ids) 
best r ((i,x :<>: y):ids) 
best r ((i,Group x):ids) 


其 中 better 定义 改 为 


better r lx ly = if fits r (layout lx) then lx else ly 


计算 petter r 需要 的 化 简 步 数 正比 于 r+， 因此 最 多 是 w。 
现在 如 果 best 是 线性 的 ， 那 么 prettyl 运行 时 间 是 线性 的 。best 的 第 二 个 参数 
是 缩 进 和 文档 二 元 组 列表 ， 可 以 定义 这 个 列表 的 规模 为 


isize ids = sum [size x | (i,x) <- ids] 


对 于 best 定义 中 间 5 个 子 句 的 每 一 个 来 说 ， 其 规模 都 减 小 了 1。 例 如: 


isize ((i,x :<>: y):ids) 

= Size (x :<> y) + isize ids 

= 1 + size x + size y + isize ids 
= 1 + isize ((i,x):(i,y):ids) 


由 此 推出 ， 如 果 用 7(s) 表示 best 上 在 规模 为 的 输入 上 的 运行 时 间 ， 那 么 由 best 
的 第 一 个 子 句 得 出 7(0) =@(1) ， 对 于 中 间 5 个 子 句 有 7T(s +1) =@(1) +7T(s)， 而 且 对 最 
后 一 个 于 句 有 
T(s+1) = @(w) + maximum[ T(k) + T(s ~ k)|1lk<*—[1..s—-1|| 
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现在 可 以 推出 7(s) =O(ws)。 
总 之 ， 尺 管 算 法 pretty 依赖 于 w， 但 它 是 线性 的 。 


8.9 注 记 


我 们 把 美观 打印 库 称 为 一 个 库 ， 但 是 它 的 男 一 个 名 称 是 嵌入 式 领 域 专用 语言 (Embed- 
ded Domain Specific Language，EDSL)。 这 是 一 种 区 和 人 Haskell 用 于 美观 打印 文档 的 语言 。 
许多 人 认为 Haskell 的 不 断 成 功 来 自 于 它 很 便于 作为 各 种 EDSL 的 宿主 语言 。 

本 章 的 详细 内 容 主 要 基于 Philip Wadler 的 工作 ， 参 见 《The Fun of Programming in Cor- 
nerstones of Computing Series》 ( Palgrave MacMillan ，2003 ) 中 的 第 11 章 “A prettier print- 
er”。 主 要 区 别 是 ，Wadler 在 Doc 的 项 表示 中 使 用 了 显 式 的 选择 算 子 (不 过 对 用 户 是 隐藏 
的 ) ， 而 不 是 构造 图 数 Group。Jeremy Gibbons 建议 后 者 更 适合 深 骨 人。 

更 早 的 函数 式 美 观 打印 库 是 John Hughes 设计 的 “The design of a pretty-printer library”,， 
该 库 基 于 一 组 不 同 的 组 合算 子 ， 参 见 Johan Jeuring 和 Erik Meijer 等 编辑 的 Advanced Func- 
tional Programming, volume 925 of LNCS，Springer，1995 。Simon Peyton Jones 对 Hughes 的 
库 做 了 改造 ， 并 作为 一 个 Haskell 库 安 装 为 Text .PrettyPrint .HughesPJ。 

男 一 个 命令 式 而 不 是 函数 式 的 美观 打印 库 是 30 年 前 由 Derek Oppen 设计 的 “Pretty- 
printing”， 参 见 ACM Transactions on Programming Languages and Systems 2 (4), 465-483, 
1980， 而 且 该 库 是 广泛 用 于 多 种 语言 美观 打印 的 基础 。 最 近 ，0laf Chitil 提出 了 高 效 的 天 
数 式 美观 打印 算法 ， 参 见 Pretty printing with lazy dequeues, ACM Transactions on Program- 
ming Languages and Systems 27(1 ) ，163-184，2005 ， 以 及 Olaf Chitil 、Doaitse 和 Swierstra 的 
Linear, bounded, functional pretty-printing, Journal of Functional Programming 19(1), 1-16, 


2009。 与 本 书 介绍 的 算法 相 比 ， 这 些 算法 相当 复杂 。 
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无 穷 列 表 


我 们 在 第 4 章 已 经 遇 到 了 无 穷 列 表 ， 而 且 在 第 6 章 给 出 了 无 穷 列表 上 的 归纳 证 明 原 
理 。 但 是 ,我 们 还 没有 真正 认识 无 穷 列表 的 作用 。 本 章 将 详细 解释 什么 是 无 穷 列表 ， 如 何 
用 循环 (cyclic) 结构 表示 它们 。 本 章 还 将 解释 无 穷 列表 上 另 一 个 有 用 的 推理 方法 ， 并 讨 
论 一 些 有 趣 的 例子 ， 其 中 使 用 无 穷 列表 和 循环 结构 取得 了 很 好 的 效果 。 


9.1 复习 
回顾 [m. . ] 表示 m 之 后 所 有 整数 的 列表 : 
ghci> [1..] 
[1,2,3,4,5,6,7,{Interrupted} 


ghci> zip [1..] "hallo" 

【了 
输出 [1 . .] 需 要 无 穷 的 时 间 ， 所 以 这 里 中 断 了 第 一 个 例子 的 计算 。 第 二 个 例子 表达 了 无 穷 
列表 的 一 个 简单 但 是 很 典型 的 应 用 。 

在 Haskell 中 ， 算 术 表 达 式 [m. .] 被 翻译 成 enumFrom m， 其 中 enumFrom 是 类 族 
Enum 的 一 个 方法 ， 定义 为 


enumFrom :: Integer -> [Integer] 
enumFrom m = m:enumFrom (m+1) 


因此 ，[m. .] 是 递归 定义 函数 的 一 个 特例 。 因 为 (: ) 对 第 二 个 参数 是 非 严 格 的 ， 所 以 
计算 得 以 。 
需要 记 住 的 是 ， 无 穷 列表 的 计算 与 数学 上 无 穷 集合 的 计算 不 同 。 例 如 ， 在 集合 论 中 有 
[xl x ell,2,3,.…} ,x < 101 
表示 集合 11，2，3} ,但 是 


ghci> [x | x <- [1..], x*x < 10] 
lL4 ,3 


输出 前 三 个 值 后 ， 计 算 机 不 停 地 寻找 3 之 后 下 一 个 平方 小 于 10 的 数 ， 因 此 陷 人 无 限 
循环 。 上 述 表 达 式 的 值 是 非 完整 列表 1 :2 :3 :undefined。 

构造 无 穷 列表 的 无 穷 列 表 也 是 可 行 的 。 例 如 ， 下 列表 达 式 是 无 穷 列 表 的 无 穷 列表 : 

multiples = [map (n*) [1..] | n <- [2..]] 
其 中 前 三 个 是 

LG 

假如 我 们 想 知 道 以 上 列表 的 列表 是 否 可 以 归并 为 一 个 列表 ， 即 [2 . . ] 。 归 并 两 个 无 穷 
列表 没有 问题 : 
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merge :: Ord a => [a] -> [a] -> [a] 

merge (x:xs) (y:ys) | x<y = x:merge xs (y:ys) 
| x==y = x:merge xs ys 
| x>y = y:merge (x:xs) ys 


以 上 merge 删除 了 重复 出 现 的 元 素 : 如 果 两 个 列表 严格 递增 ， 那么 结果 也 是 严格 北 
增 的 。 注 意 merge 没有 一 个 子 句 说 明 空 列表 的 情况 。 现 在 ， 如 果 定 义 


mergeAll = foldrl merge 


看 似 mergeAll multiples 将 返回 无 穷 列表 [2 . .]。 但 是 ， 事情 不 是 这 样 的 。 结 果 是 计 
算 机 陷入 尝试 计算 结果 的 第 一 个 元 厅 的 无 限 循环 中 ， 即 


minimum (map head multiples) 


很 简单 ， 在 一 个 无 穷 列表 中 求 最 小 元 是 不 可 能 的 。 所 以 ， 必 须 使 用 map head mul- 
tiples 是 严格 递增 的 事实 ， 并 定义 


mergeAll = foldrl xmerge 
xmerge (x:XxXs) ys = x:merge xs ys 


利用 这 个 定义 ，mergeAll multiples 确实 可 以 输出 [2..]。 

最 后 ， 回 顾 第 6 章 描述 的 无 穷 列表 上 的 归纳 原理 。 只 要 P 是 一 个 链 完 全 的 性 质 ， 要 让 
明 P(xs) 对 于 所 有 的 无 穷 列 表 xs 成 立 ， 只 要 证 明 : (1 ) P(undefined) 成 立 ; (11) 
如 果 P(xs) 成 立 ， 那么 P(x:xs) 对 于 所 有 x 和 xs 成立。 利用 这 个 原则 ， 我 们 在 第 6 
章 证 明了 对 于 所 有 无 穷 列表 xs，xs ++ys = xs 成 立 。 但 是 ， 并 不 是 很 清楚 如 何 用 归纳 
法 证 明 如 下 等 式 : 


map fact [0..] = scanl (*) 1 [1..] 


明显 地 应 该 证 明 


map fact [0..n] = Scanl (*) 1 [1. .Dj 


对 于 所 有 n 成 立 ， 但 是 ， 这 样 能 够 断定 第 一 个 等 式 成 立 吗 ? 


9.2 循环 列表 
像 函 数 一 样 ， 数 据 结构 也 可 以 递归 定义 。 例 如 : 


ones :: [Int] 
ones = 1:ones 


这 是 循环 (cyclic) 列表 即 递归 定义 的 列表 的 一 个 例子 。 将 这 个 定义 写 ones = repeat 1 
比较 ， 其 中 : 


repeat x = x:repeat x 


ones 的 这 个 定义 构造 了 一 个 无 穷 列表 ,但 不 是 一 个 循环 列表 。 可 以 定义 : 


repeat x = xs where xs = XIXS 


现在 函数 repeat 是 用 循环 列表 定义 的 。 第 二 个 定义 ( 称 为 repeat2) 的 计算 比 第 一 个 
( 称 为 repeat1) 快 ， 因 为 开销 更 少 : 


212 


L213 


ee 


ghci> last $ take 10000000 $ repeatl 1 
由 

(2.95 secs, 800443676 bytes) 

ghci> last $ take 10000000 $ repeat2 1 
和 

(0.11 secs, 280465164 bytes) 


再 看 一 个 例子 。 考 虑 标准 引 寻 库 函 数 iterate 的 下 列 三 个 定义 : 


iterate1 f x = Xiiteratel f (f x) 
iterate2 f x = xs Where xs = x:map f xs 
iterate3 f x = x:map f (iterate3 f x) 


三 个 定义 的 类 型 均 为 (a -> a) -> a -> [a]， 而且 结果 都 是 反复 应 用 f£ 于 x 的 无 穷 列 

表 。 三 个 函数 是 相等 的 ， 但 是 早 前 的 归纳 原理 似乎 不 能 用 来 证 明 这 个 命题 ， 因 为 找 不 到 能 

够 进行 归纳 的 变量 。 后 面 会 对 此 做 进一步 讨论 。 第 一 个 定义 是 标准 引导 库 的 定义 ,但 是 这 

里 并 没有 构造 任何 循环 列表 。 第 二 个 定义 构造 了 循环 列表 ， 第 三 个 定义 只 是 在 第 二 个 定义 

中 消去 了 where 子 句 。 假定 £ x 可 以 用 常数 时 间 计 算 ， 第 一 个 定义 需要 BB(n) 步 计 算 前 n 

个 元 素 , 但 是 第 三 个 定义 需要 B@(n ) 步 : 

iterate3 (2*) 1 

1:map (2*) (iterate3 (2*) 1) 

1:2:map (2*) (map (2*) (iterate3 (2*) 1)) 

1:2:4:map (2*) (map (2*) (map (2*) (iterate3 (2*) 1))) 

其 中 计算 第 个 元 素 需 要 (2*) 的 nn 次 应 用 ， 所 以 生成 前 个 元 素 总 共 需 要 B@(n ) 步 。 
现在 剩 下 第 二 个 定义 了 。 第 二 个 定义 需要 线性 时 间 还 是 二 次 方 时 间 ? 表达 式 

iterate2 (2*) 1 的 求 值 过 程 如 下 : 


XS Where xs = 1:map (2*) xs 
= 1:ys Where ys = map (2*) (1:ys) 
= 1:2:2zs where zs = map (2*) (2:2zs) 
= 1:2:4:ts Where ts = map (2*) (4:ts) 


生成 结果 的 每 个 元 素 需 要 常数 时 间 ， 所 以 iterate2 (2*) 1 输出 nn 个 元 隶 需要 OQ(n) 
时 间 。 
现在 构造 一 个 循环 列表 ， 以 生成 所 有 紊 数 的 无 穷 列表 。 开 始 先 定义 : 


primes = [2..] \\ composites 
composites = mergeAll multiples 
multiples = [map (n*) [n..] | n <- [2..]] 


其 中 (\\ 从 一 个 严格 递增 的 列表 中 减 去 为 一 个 严格 递增 的 列表 : 
(x:xs) \\ (yi:ys) | x<y = x:(xs \\ (y:ys)) 
| x==y = xs \\ ys 
| x>y = (x:xs) \\ ys 
这 里 multiples 的 构成 是 ， 从 4 开始 的 所 有 2 的 倍数 构成 的 列表 ， 从 9 开始 的 所 有 
3 的 倍数 构成 的 列表 ， 从 16 开始 的 所 有 4 的 倍数 构成 的 列表 ， 等 等 。 合 并 这 些 列 表 得 到 所 
有 的 合 数 构成 的 列表 ， 然 后 关于 [2 . . ] 取 补 得 到 所 有 素数 。mergeaAll 的 定义 在 9.1 节 已 
给 出 。 
到 目前 为 止 , 一 切 顺利 。 但 是 ， 如 采 注 意 到 太 多 的 倍数 被 合并 到 合 数 中 ， 那 么 算法 通 
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过 改进 可 以 快 许多 倍 。 例 如 ， 已 经 构造 了 2 的 倍数 ， 没 必要 再 构造 4 的 倍数 ， 或 者 6 的 们 
数 等 。 我 们 真正 想 构 造 的 是 素数 的 倍数 ， 由 此 导出 “ 打 一 个 递归 结 ” 的 思想 ， 定 义 : 


primes = [2..] \\ composites 

Where 

composites = mergeAll [map (p*) [p..] | p <- primes] 

以 上 是 primes 的 一 个 循环 定义 。 定 义 看 起 来 不 错 ， 但 是 可 行 吗 ? 不 六 的 是 ， 答 案 是 
否定 的 : primes 生成 无 定义 列表 。 为 了 确定 primes 的 第 一 个 元 素 ， 计 算 过 程 需要 得 到 
composites 的 第 一 个 元 素 ， 后 者 又 需要 primes 的 第 一 个 元 素 。 所 以 计算 陷入 无 限 循 
环 中 。 要 解决 这 个 问题 ， 必 须 显 式 给 出 第 一 个 素数 ， 从 而 从 计算 中 抽出 素数 ! 因此 需要 如 
下 改写 定义 : 


primes = 2:([3..] \\ composites) 
where 
composites = mergeAll [map (p*) [p..] | p <- primes] 


但 是 这 个 定义 仍然 不 能 输出 素数 ! 原因 是 细微 的 ， 而 且 不 易 发 现 。 这 和 下 面 的 定义 有 关 : 


mergeAll = foldrl xmerge 


秘 事 者 是 foldarl 的 定义 。 回 顾 它 的 Haskell 定义 : 


foldri :: (a -> a -> a) -> [a] -> a 
foldrl f [x] 二 式 
foldrl f (x:xs) = f x (foldri xs) 


定义 的 两 个 等 式 顺序 很 关键 。 特 别 是 
foldrl f (x:undefined) = undefined 
因为 列表 参数 首先 与 x: [] 匹配， 由 此 导致 结果 为 undefined。 这 表示 
mergeAll [map (p*) [p..] | p <- 2:undefined] = undefined 
真正 需要 的 是 
mergeAll [map (p*) [p..] | p <- 2:undefined] = 4:undefined 
为 了 得 到 这 个 效果 ， 需 要 给 mergeAll 不 同 的 定义 : 
mergeAll (xs:xss) = xmerge xs (mergeAll xss) 


现在 有 


mergeAll [map (p*) [p..] | p <- 2:undefined] 
= xmerge (map (2*) [2..]) undefined 
= xmerge (4:map (2*) [3..]) undefined 
= 4:merge (map (2*) [3..]) undefined 
= 4:undefined 


这 个 mergeA1ll 定义 在 有 穷 列 表 上 的 表现 不 同 于 前 一 个 定义 。 为 什么 ? 

做 了 最 后 的 修改 后 ， 可 以 说 primes 真正 进入 正轨 了 。 但 是 如 何 证 明 这 个 结论 呢 ? 回 
答 这 个 问题 需要 了 解 Haskell 中 关于 递归 定义 的 函数 和 值 的 语义 ， 以 及 无 穷 列表 如 何 定义 
为 它们 的 非 完整 列表 逼近 的 极限 。 


9.3 作为 极限 的 无 穷 列表 
在 数学 上 茶 些 值 定义 为 更 简单 值 的 无 限 通 近 序列 的 极限 (limit)。 例 如 ， 无 理 数 
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mT = 3.14159265358979323846… 
可 以 定义 为 下 列 有 理 数 无 穷 序列 的 极限 : 
3 B11, 314 3141, 3.1413. = 
第 一 个 元 素 3 是 的 非常 粗 的 逼近 ， 下 一 个 元 素 3. 1 是 好 一 点 的 通 近 ，3. 14 是 更 好 的 通 
近 ， 等 等 。 
类 似 地 ， 一 个 无 穷 列表 也 可 以 看 成 一 个 逼近 序列 的 极限 。 例 如 ， 无 穷 列 表 [1 . .] 是 下 
列 非 完 整 列 表 的 极限 : 
1 a, ， 工 :汉人 和 。 wm 
同样 ， 序 列 是 极限 值 越 来 越 好 的 逼近 。 第 一 项 上 是 无 定义 的 元 素 ， 因 此 是 非常 粗 的 通 
近 : 它 没 有 极限 的 任何 信息 。 下 一 个 元 素 1: 1 要 好 一 点 : 它 说 明 极 限 是 一 个 列表 ， 其 第 一 
个 元 素 是 1, 但 是 关于 列表 的 尾部 则 没有 任何 信息 。 接 下 来 的 项 1:2; 1 更 好 一 点 ， 等 等 。 
每 个 更 好 的 后 续 逼 近 都 用 另 一 个 有 定义 的 值 代替 上 ， 因 此 给 出 极限 的 更 多 信息 。 
下 面 是 另 一 个 远近 序列 ， 其 极限 是 [1..]: 
该 序列 是 前 一 个 序列 的 子 序列 ， 但 是 它 也 收敛 于 同样 的 极限 。 
下 面 是 一 个 不 收敛 于 任何 极限 的 逼近 序列 : 
上 上 上， 
这 个 序列 的 问题 在 于 它 给 出 的 信息 是 矛盾 的 : 第 二 项 说 明 极 限 的 第 一 个 元 素 是 1, 但 是 ， 
第 三 项 说 明 极限 的 首 元 素 是 2， 第 四 项 又 说 明 极限 的 首 元 素 是 3， 等 等 。 没 有 一 个 通 近 说 
明 它 们 的 极限 是 什么 ， 所 以 该 序列 不 收敛 。 
不 应 该 认为 一 个 列表 序列 的 极限 必须 是 无 穷 的 。 例 如 ， 下 列 序列 : 
La iL, al | |] ww 
其 中 从 第 三 项 开始 的 每 个 元 素 都 是 [1] ， 这 是 完全 合理 的 序列 ， 其 极限 为 [1] 。 类 似 地 ， 
Ly elds lwals ls ws 
是 以 1:2: 1 为 极限 的 序列 。 有 穷 列表 和 非 完 整 列表 是 只 包含 有 穷 个 不 同 的 元 素 序 列 的 
极限 。 
形式 上 表达 非 完整 列 表 的 无 穷 序 列 收敛 于 一 个 极限 的 方法 是 在 每 个 类 型 的 元 系 上 引入 
逼近 序 (approximation ordering) EE 的 概念 。 源 言 %*5y 表示 x 是 y 的 一 个 通 近 。 厅 5 是 目 反 
的 (xEx)、 传 递 的 (如 果 x5Ey 并 且 y5Ez， 那么 zxEz) 和 反对 称 的 (如 果 x5y 并 且 yEx， 
那么 x*=y)。 但 是 ， 该 序 并 不 要 求 每 一 对 元 素 关于 5 可 比较 。 因 此 ，5 称 为 偏 序 (partial 
ordering) 。 注 意 ，c 是 一 个 数学 符号 (如 =) ， 并 不 是 一 个 返回 布尔 值 的 Haskell 运算 符 。 
数值 、 布 尔 、 字 符 和 任意 其 他 枚 举 类 型 上 的 通 近 序 定义 如 下 : 
YEY=(X = 上 ) VCZ =y) 
第 一 个 子 句 表 示 上 是 所 有 元 素 的 通 近 。 换 言 之 ， 上 是 该 序 的 底部 (bottom) 元 素 ， 简 称 底 
元 。 这 也 解释 了 为 什么 上 读 作 “底部 (bottom)”。 值 上 是 任何 类 型 上 通 近 序 5 的 底 元 。 上 
面 定义 的 序 是 平坦 的 〈flat) 。 对 于 平坦 序 ， 我 们 或 者 知道 一 个 值 的 一 切 信息 ， 或 者 没有 任 
何 信息 。 
类 型 (a,，b) 上 的 序 定 义 为 上 LE (x*，y) ， 而 且 


-二 光明 和 _ =- -- =- 


(%,7) E(x ,7 ) (Ex ) AC7EY ) 
右边 E 的 出 现 分 别 指 类 型 a 和 类 型 5 上 的 通 近 序 。 类 型 (a, b) 上 的 序 S 不 是 平坦 的 ， 即 使 
其 分 类 型 上 的 通 近 序 是 平坦 的 。 例 如 ， 在 类 型 (Bool, Boo1l) 上 有 下 列 不 同 元 素 间 的 链 : 
ESE(L,， 1L)S(L,False)E(True,FPalse) 
注意 在 Haskell 中 二 元 组 (上 ， 上 ) 不 同 于 上 : 

ghci> let f (a,b) = 1 

ghci> f (undefined,undefined) 

a f undefined 

*** Exception: Prelude.undefined 

类 型 [a] 上 的 序 5 定 义 为 LExs,，(x:xs) K[] ， 而 且 

[] sxs=xs = {] 
(KB E(yiyYs)=(xEyY) A(xsEys) 
这 些 等 式 应 该 看 作 一 个 数学 断言 的 归纳 定义 ， 而 不 是 Haskell 定义 。 第 二 个 条 件 表示 [] 只 
是 自己 的 双 近 ， 第 三 个 条 件 表 示 (x :xs) 是 (y:ys) 的 通 近 当 且 仅 当 x 是 Y 的 通 近 ， 而 且 
xs 是 ys 的 通 近 。 定 义 右 边 E 的 第 一 次 出 现 表 示 类 型 a 上 的 通 近 序 。 
[ls L311 人 231 而 县 1 二 于 这 | 
但 是 ，1:2: 上 和 [1， 上 ，3] 关于 5 不 可 比较 。 

每 个 类 型 7 上 的 通 近 序 除 以 上 描述 的 性 质 外 ， 还 有 另外 一 个 性 质 : 每 个 通 近 链 
(chain) xoS wi 5… 必 须 在 7 中 具有 一 个 极限 。 用 limx, 表示 的 该 极限 由 下 列 两 个 条 件 
定义 : 

1. x, climx, 对 于 所 有 的 成 立 。 这 个 条 件 表示 极限 是 逼近 序列 的 上 界 (upper bound ) 。 

2. 如 果 对 于 所 有 的 有 x, Sy， 那 么 limx, 5y。 这 个 条 件 表示 极限 是 最 小 上 界 。 

允 近 链 的 极限 定义 适用 于 任何 类 型 。 具 有 这 种 性 质 的 偏 序 称 为 完全 的 (complete)， 而 
上 且 每 个 Haskell 类 型 是 一 个 完全 偏 序 (Complete Partial Ordering，CPO)。 特 别 是 ， 第 6 章 引 
入 的 P 的 链 完 全 性 质 断 言 现在 可 以 描述 为 

(CVn:P(x,)) =P( limx,) 
换 句 话说 ， 如 果 尸 对 于 极限 的 每 个 通 近 成 立 ， 那 么 己 对 于 极限 成 立 。 

Haskell 有 一 个 关于 列表 的 有 用 函数 appzox， 该 函数 生成 一 个 给 定 列表 的 通 近 。 其 定 
义 如 下 : 


approx :: Integer -> [a] -> [a] 
approx n [] | n>0 = [] 
approx n (x:xs) | n>20 = x:approx (n-1) xs 


滑 数 approx 的 这 个 定义 非常 类 似 于 take， 区 别 在 于 分 情况 定义 ， 对 于 任意 xs， 有 


approx 0 xs = undefined。 例如 : 


approx 0 [1] = undefined 
approx 1 [1] = i:undefined 
approx 2 [1] = 1:[] 
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approx 最 关键 的 性 质 是 
lim approx n xs = Xs 
对 于 任意 列表 xs ， 包 括 有 穷 、 非 完整 和 无 穷 列表 都 成 立 。 证 明 可 以 在 xs 上 归纳 进行 ， 留 
作 练 习 。 
由 此 得 出 ， 如 果 approx n xs = approx n ys 对 于 所 有 的 卓然 数 n 虱 成 立 ， 那 么 
xs =ys。 因 此 可 以 通过 证 明 


approx n (iterate f x) = approx n (x:map f (iterate f x)) 


对 于 所 有 的 自然 数 nn 成立 来 证 明 


iterate f x = x:map f (iterate f x) 


当然 ， 前 一 个 等 式 的 证 明 可 以 对 自然 数 进行 归纳 。 证 明 留 给 读者 作为 练习 。 
再 来 看 一 个 例子 ， 考 虑 9. 2 节 和 定义 的 primes。 假 如 定义 : 


prs D = apProx n primes 


要 想 证 明 prs n =pi: py: …p,: 上 ， 其 中 六 是 第 ) 个 素数 ， 则 需 证 明 : 


prs n = approx n (2:([3..] \\ crs D)) 
crs n = mergeAll [map (p*) [p..] | p <- prs n] 


利用 这 些 条 件 ， 可 以 证 明 crs n =c: c: …cn: 上 ， 其 中 6c 是 第 j 个 合 数 (如 c=4) 而 
且 m=ps。 然 后 可 以 利用 不 等 式 p,,, <p; 完成 证 明 ， 只 是 这 个 不 等 式 是 数论 中 的 一 个 非 平 
几 结 论 。 详 情 见 习题 。 


可 计算 函数 与 递归 定义 


我 们 可 以 描述 许多 数学 图 数 ， 但 是 只 有 一 部 分 是 可 计算 的 。 可 计算 函数 有 两 个 性 质 是 
其 他 函数 不 具有 的 。 第 一 ， 一 个 可 计算 函数 关于 通 近 序 是 单调 的 〈monotonic ) 。 用 符号 来 
表示 ， 对 于 所 有 的 x 和 y， 有 

tCyS x) Ef(y) 
粗略 地 讲 ， 单 调 性 表示 对 于 参数 提供 的 信息 越 多 ， 得 到 的 结果 的 信息 也 越 多 。 第 二 ， 一 个 
可 计算 函数 是 连续 的 (continuous)， 也 就 是 说 
flim%,) = limf(x,) 
对 于 所 有 的 逼近 链 xo Ex E… 成 立 。 连 续 性 大 致 表示 ， 如 果 参 数 有 极限 ， 那 么 结果 也 有 
极限 。 

连续 性 看 似 与 链 完全 性 相似 ， 但 是 它们 在 两 方面 不 同 。 一 方面 ， 忆 的 链 完 全 性 并 不 意 
味 着 如 果 尸 对 于 所 有 通 近 不 成 立 ， 则 已 对 其 极限 也 不 成 立 。 换 言 之 ， 它 并 不 能 推出 -已 是 
链 完 全 的 。 另 一 方面 ,已 是 一 个 数学 命题 ， 不 是 返回 布尔 值 的 Haskell 函数 。 

这 里 不 加 证 明 但 给 出 一 个 结果 : 每 个 单调 旦 连续 的 函数 1 具有 一 个 最 小 不 动 点 (least 
fixed point) 。 一 个 图 数 j 的 不 动 点 是 使 得 所 xz) =x 的 值 x*。 称 x 是 最 小 不 动 点 ， 如 果 对 于 所 
有 的 其 他 不 动 点 y 有 x5y。 一 个 单调 连续 函数 的 不 动 点 由 极限 limx, 给 出 ， 其 中 x。= 上 ， 
Xr1 = 了 A(%,)。 在 函数 式 程序 设计 中 ， 递 归 定 义 被 解释 为 最 小 不 动 入 。 

下 面 是 三 个 例子 。 第 一 个 例子 考虑 定义 ones =1 :ones，, 该 定义 表示 ones 是 函数 


无 穷 列表 


(1 :) 的 一 个 不 动 点 。Haskell 将 其 解释 为 最 小 不 动 点 ， 所 以 ones = lim ones,， 其 中 
oneso = 上 ，ones,,;=1: ones,。 容 易 看 出 ，ones, 是 nn 个 1 构成 的 非 完 整 列表 ， 所 以 


其 极限 确实 是 无 穷 个 1 的 列表 。 
第 二 个 例子 考虑 阶乘 函数 : 


fact n = if n==0 then 1 else n*fact (n-1) 


可 以 将 该 函数 改写 为 下 面 的 等 价 形式 


fact = (\f n -> if n==0 then 1 else n*f(n-1)) fact 


同样 ， 这 个 函数 说 明 fact 是 一 个 函数 的 不 动 点 。 对 这 个 例子 ， 有 
facton= | 
facti n= if n==0 then 1 else 1 
fact n=if n<=1 then 1 else | 


等 等 。 如 果 nn 小 于 k， 那 么 factin 的 值 是 的 阶乘 ,否则 是 上 。 
第 三 个 例子 再 次 考虑 列表 primes。 对 这 个 例子 ， 有 
primeso = | 
primes,,! = 2:([3..] \\ 

mergeAll [map (p*) [p..] | p <- primes,]) 


这 里 并 不 是 指 primes, =approx n primes。 事 实 上 ,有 
Primesl =2 :上 
primes; =2:3:1 
primesa=2:3:5:7:1 
primess =2:3:5:7:...:47:1 


非 完 整 列 表 primes, 生成 小 于 4 的 所 有 素数 ，primes 生成 小 于 9 的 所 有 素数 ， 


primes 生成 小 于 49 的 所 有 素数 ， 等 等 。 
9.4 石头 -剪刀 - 布 


下 一 个 无 穷 列表 的 例子 可 谓 离 教 于 乐 。 这 个 例子 不 仅 介绍 使 用 潜在 无 穷 列表 来 表示 两 
个 进程 则 的 交互 序列 的 思想 ， 而 且 提 供 了 男 一 个 说 明 做 形式 化 分 析 必 要 性 的 具体 例子 。 

石头 -剪刀 - 布 游 戏 是 妇 丘 丝 知 的 游戏 ， 只 是 不 同 的 地 方 它 的 名 称 可 能 不 同 。 游 戏 在 两 
个 玩家 之 间 面 对 面 进 行 ， 每 个 玩家 在 自己 背后 做 出 形 如 石头 〈 紧 握 的 拳头 ) 或 者 布 ( 伸 
展 的 手掌 ) 或 者 筋 刀 《〈 两 个 伸 开 的 手指 ) 的 手势 ， 在 约定 的 时 刻 同 时 亮 出 藏 在 背后 的 手 
苏 。 箱 顾 规 则 为 “ 布 包 石 头 ， 石 头 钝 和 剪刀， 剪刀 前 布 " 。 因 此 ， 如 果 玩 家 1 伸 出 石头 ， 玩 
家 2 伸 出 剪刀 ， 那 么 玩家 1 赢 ， 因 为 石头 可 以 钝 剪刀 。 如 果 两 个 玩家 伸 出 同一 种 手势 ， 那 


么 纺 采 是 平局 ， 没 有 顾家 。 游 戏 以 这 种 方式 连续 进行 事先 约定 数目 的 回合 。 
本 市 的 目标 是 设计 一 个 玩 这 种 游戏 并 记录 分 数 的 程序 。 首 先 从 引入 类 型 开始 : 


data Move = Paper | Rock | Scissors 
type Round = (Move,Move) 


给 一 个 回合 计 分 ， 定义 : 
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Score :: Round -> (Int,Int) 

Score (x,y) | x “beats” y = (1,0) 
| y ‘beats. x = (0,1) 
| otherwise = (0,0) 


Paper ‘beats’ Rock = True 
Rock “beats” Scissors = True 
Scissors “beats ”Paper = True 


.beats. _ = False 


游戏 的 每 个 玩家 将 被 表示 成 某 种 策略 。 例 如 ， 一 种 简单 策略 是 ， 在 第 一 个 回合 后 每 次 
选择 对 手 上 一 个 回合 的 出 手 。 这 个 策略 称 为 copy。 男 一 策略 基于 一 定 的 分 析 和 计算 做 出 
回应 ， 称 为 smart ， 其 方法 是 通过 分 析 对 手 已 经 做 出 的 每 种 出 手 的 次 数 ， 基 于 一 定 的 概 
率 计算 适当 的 下 一 次 出 手 。 

稍 后 将 考虑 特定 策略 的 细节 ， 以 及 这 些 策 略 如 何 表 示 。 目 前 先 假定 类 型 Strategy 
用 某 种 方式 给 出 。 引 入 函数 : 


rounds :: (Strategy,Strategy) -> [Round] 


对 于 一 对 策略 ,该 函数 返回 当 每 个 玩家 根据 其 策略 出 手 时 的 无 穷 回合 列表 。 下 列 函 数 决定 
给 定 轮 次 猜拳 后 的 成 绩 : 


match :: Int -> (Strategy,Strategy) -> (Int,Int) 
match n = total . map Score . take n . rounds 
where total rs = (sum (map fst rs),sum (map snd rs)) 


该 游戏 中 具有 教育 意义 的 是 如 何 表 示 策 略 。 考 虑 两 种 表示 方式 ,分 别称 为 Strat- 
edyl 和 Strategy2。 最 明显 的 想法 是 定义 : 


type Strategyl = [Move] -> Move 


这 里 策略 表示 成 一 个 函数 ， 该 函数 的 输入 是 对 手 到 目前 为 止 的 出 手 (有 穷 ) 列表 ,返回 值 
是 下 一 轮 的 出 手 。 为 了 处 理 列表 方便 ,假定 出 手 的 列表 用 逆序 列 出 ， 即 最 后 的 出 手 是 列表 
的 第 一 个 元 素 。 

例如 ， 策 略 copy1 是 如 下 实现 的 : 


copyl :: Strategyl 
Copyl ms = if null ms then Rock else head ms 


第 一 个 出 手 是 随意 选择 的 Rock， 第 二 个 策略 smartl 如 下 定义 : 


Smart1lT :: Strategyl 
Smartl ms = if null ms then Rock 
else pick (foldr count (0,0,0) ms) 


count :: Move -> (Int,Int,Int) -> (Int,Int,Int) 
count Paper (p,r,s) = (p+1,r,s) 
count Rock (p,r,s) = (p,r+1,s) 
count Scissors (p,r,s) = (p,r,s+1) 


pick :: (Int,Int,Int) -> Move 
pick (p,r,s) 

| m< P = Scissors 

| m< ptr = Paper 

| otherwise = Rock 

Where m = rand (p+r+s) 
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这 个 策略 首先 计算 每 种 手势 出 现 的 次 数 ， 然 后 根据 这 个 结果 选择 一 种 手势 。Rand 应 用 于 
n 人 返回 一 个 整数 m， 而 且 0<m<n。( 注 意 rand 永远 不 会 应 用 于 同一 个 整数 。) 所 以 ,最 
后 做 出 的 选择 依赖 于 mm 落 入 下 面 三 个 区 间 中 哪 一 个 : 
0 二 m <p 或 者 pp 三 m<p+r 或 者 p+r<m<p+rts 
例如 ， 如 果 p 很 大 ， 那么 Scissors 被 选中 的 概率 很 大 (因为 前 刀 剪 布 ); 如果 很 大 ， 
那么 Paper 被 选中 的 概率 大 〈 因 为 布 包 石头 ) ;等 等 。 
为 定义 rand， 利 用 库 System.Randonm 的 两 个 函数 ， 


rand :: Int -> Int 
rand n = fst $ randomR (0,n-1) (mkStdGen n) 


水 数 mkstdGen 输入 一 个 整数 ， 返 回 一 个 随机 数 生 成 句 ， 不 同 的 整数 可 能 得 到 不 同 的 生成 

做 。mkStdaGen 的 参数 选择 是 任意 的 ， 这 里 简单 取 nm。 函数 randomR 取 一 个 区 间 (a,。) 

与 一 个 随机 数 生成 器 ， 返 回 区 间 a<r<45 上 的 一 个 伪 随 机 数 r 和 一 个 新 的 随机 数 生成 器 。 
现在 可 以 定义 roundsl: 


rounds1 :: (Strategyl,Strategy1) -> [Round] 
roundsl1 (pl,p2) 

= map head $ tail $ iterate (extend (pl1,p2)) [ 
extend (pl,p2) rs = (pl (map snd rs),p2 (map fst rs))i:rs 


函数 extend 在 现 有 回合 列表 前 添加 一 对 新 的 出 手 ，rounds1l 在 初始 的 空 回合 列表 上 不 
断 添 加 新 的 回合 ， 从 而 生成 无 穷 的 回合 列表 。 在 列表 前 添加 元 素 比 在 尾部 添加 元 素 更 高 
效 ， 这 是 回合 列表 用 逆序 表示 的 原因 。 

不 过 rounds1l 的 效率 不 高 。 假 设 一 个 策略 需要 正比 于 其 输入 长 度 的 时 间 计 算 下 一 个 
出 手 。 由 此 得 出 extend 需要 B@(n) 步 用 一 个 新 回合 更 新 nn 个 回合 的 游戏 。 因 此 , 计算 入 
个 回合 的 游戏 需要 @(N ) 步 。 

为 了 进行 比较 ， 考 虑 另 一 个 策略 的 合理 表示 。 这 次 定义 : 


type Strategy2 = [Move] -> [Move] 


在 新 的 表示 中 ， 策略 是 一 个 函数 ， 函 数 的 输入 是 对 手 的 出 手 潜在 无 穷 列 表 ， 输 出 是 回应 对 
手 的 潜在 出 手 无 穷 列表 。 例 如 ，copy 策略 现在 可 以 这 样 实现 : 


copy2 :: Strategy2 
copy2 ms = Rock:ms 


该 策略 首次 返回 Rock， 以 后 每 次 都 返回 对 手 前 一 回合 的 出 手 。smart 策略 如 下 
实现 : 
smart2 :: Strategy2 


smart2 ms = Rock:map pick (stats ms) 
Where stats = tail . scanl (flip count) (0,0,0) 


其 中 函数 stats 计算 3 种 手势 出 现 的 次 数 。 像 copy2 一 样 ， 这 个 策略 也 是 高 效 的 ， 它 可 
以 在 常数 时 间 返 回 每 个 后 续 的 出 手 。 
使 用 新 的 策略 模型 ， 吗 数 rounds 可 以 重 定义 如 下 : 


rounds2 :: (Strategy2,Strategy2) -> [Round] 
rounds2 (pl,p2) = zip xs ys 
where xs = pl ys 
ys = p2 xs 


150 第 9 章 


这 里 xs 是 第 一 个 玩家 根据 列表 ys 计算 出 的 应 对 出 手 列表 ， 而 ys 是 第 二 个 玩家 根据 
列表 xs 计算 出 的 应 对 出 手 列 表 。 因 此 ，rounds2 是 用 两 个 循环 列表 定义 的 ， 并 且 
必须 说 明 该 函数 确实 生成 良好 定义 的 回合 的 无 穷 列 表 。 这 点 稍 后 再 做 说 明 。 如 有 果 两 个 
玩家 真正 使 用 合法 的 策略 ， 每 个 玩家 用 常数 时 间 计 算出 下 一 次 出 手 ， 那 么 rounds2 
用 B@(n) 步 计 算出 游戏 的 前 对 个 回合 出 手 。 因 此 ， 使 用 策略 的 第 二 个 模型 得 到 更 高 效 
的 程序 。 

不 幸 的 是 ,策略 的 第 二 种 表示 存在 严重 缺陷 ， 它 没有 提供 防 欺 骗 的 方法 ! 考虑 下 面 的 
策略 


cheat ms = map trump ms 


trump Paper = Scissors 
trump Rock = Paper 
trump Scissors = Rock 


cheat 的 第 一 次 回应 是 确保 打 赢 对 手 第 一 次 出 手 的 手势 ， 随 后 的 出 手 也 类 似 。 为 了 看 清 
楚 不 能 阻止 cheat 毁 掉 游戏 ， 考 虑 它 与 策略 copy2 的 比赛 ， 并 令 xs = cheat ys， 
ys = copy2 xs。 列 表 xs 和 ys 分 别 是 两 个 链 |xs,10<n|l 和 {ys,1 0 大 2 的 极限 ， 
其 中 ss = 1， Xa. ,=eheat VE, YB =| YS,..i =CO0BY2 xs us 现在 有 


XS1 = cheat | = | 

ys! = copy2 上 = Rock: 1 

xS2 = cheat (Rock: L) = Paper: | 

ys» = copy2 1 = Rock: | 

xs3 = cheat (Rock: |) = Paper: | 

ys3 = Copy2 (Paper: 上 ) = Rock:Paper: | 


按照 这 种 方式 重复 下 去 ,可 以 看 出 这 些 序列 的 极限 确实 是 展 好 定义 的 出 手 列表 的 极限 。 而 
且 ，cheat 总 是 开 。 男 一 种 欺骗 方法 如 下 : 


devious :: Int -> Strategy2 
devious n ms = take n (copy2 ms) ++ cheat (drop n ms) 


这 个 策略 前 个 出 手 像 拷贝 ， 然 后 开始 欺骗 。 

是 否 可 以 找到 一 种 防止 欺骗 的 方法 ?” 要 回答 这 个 问题 ， 需 要 仔细 看 看 什么 是 诚实 策 
略 。 非 正式 地 讲 ， 如 果 一 个 策略 在 计算 其 第 一 出 手 时 没有 使 用 对 手 第 一 次 出 手 的 任何 信 
息 ， 计 算 第 二 次 出 手 时 也 没有 使 用 对 手 第 二 次 出 手 的 任何 信息 ， 等 等 ， 那 么 这 个 策略 是 诚 
实 的 。 而 且 ， 假 定 对 手 的 出 手 是 良好 定义 的 ， 那 么 每 次 出 手 都 是 恨 好 定义 的 。 更 确切 地 
说 ,假设 用 wdf(n，ms) 表示 出 手 列表 ms( 可 能 非 完 整 ， 的 前 个 元 素 是 恨 好 定义 的 。 如 
果 对 于 所 有 nn 和 ms 都 有 下 列 命题 成 立 : 

wdf (n,ms)—wdf (n+1,f (ms)) 

则 称 策略 是 诚实 的 。 容 易 证 明 ，copy2 是 诚实 的 。 另 一 方面 ， 因 为 wdf(0，1 ) 真 , 但 
是 wdf(1，cheat 上 ) 不 真 ， 所 以 cheat 是 不 诚实 的 。 再 看 策略 dozy: 


dozy ms = repeat Undefined 


尽管 该 策略 不 存在 欺骗 ， 但 是 根据 定义 它 是 不 诚实 的 。 
找到 不 合法 或 者 无 意义 行为 的 根源 后 ， 能 否 确 保 只 有 诚实 的 策略 才 可 以 玩 游 戏 ? 答 
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案 是 有 条 件 的 “是 ”: 尽管 一 个 机 械 的 计算 响 不 可 能 识别 欺骗 〈 同 样 不 能 识别 上 或 者 一 
个 策略 是 否 返回 恨 好 定义 的 出 手 ) ,但 是 可 以 定义 一 个 函数 police， 使 得 如 果 p 是 一 
个 诚实 的 玩家 ，ms 是 良好 定义 的 出 手 无 穷 序列 ， 那么 police p ms =p ms。 男 一 方 
面 ， 如 果 p 在 某 时 刻 是 不 诚实 的 ， 那么 游戏 在 该 时 刻 以 上 终止 。 从 操作 语义 上 讲 ， 
police 强迫 pp 在 它 得 到 其 输入 前 返回 其 输出 的 第 一 个 ( 民 好 定义 的 ) 元 素 ， 对 于 其 他 
元 素 也 类 似 地 进行 。 其 定义 如 下 : 

police p ms = ms' Where ms' = p (synch ms ms') 

synch (x:xs) (y:ys) = (了 “seq”xX) :Synch xs ys 
回顾 第 7 章 x “seq` y 的 求 值 ， 在 返回 y 的 值 之 前 需要 先 对 x 求 值 。 证 明 这 个 定义 满足 
其 规格 说 明 需 要 很 大 的 投入 ， 故 不 在 此 详 述 。 从 上 面 的 分 析 可 以 得 出 ， 要 避免 欺骗 必须 重 
新 改写 rounds2 的 定义 如 下 : 


rounds2 (pl,p2) = zip xs ys 
Where xs = police pl ys 
ys = police p2 xs 


9.5 基于 流 的 交互 


在 石头 - 筋 刀 - 布 游戏 中 ， 使 用 了 一 个 输入 为 出 手 的 无 穷 列表 并 返回 类 似 列表 的 图 数 表 
示 交 互 。 同 样 的 思想 可 用 于 建立 输入 -输出 交互 的 简单 模型 ， 称 为 基于 流 (stream-based ) 
的 交互 ， 因 为 无 穷 列表 也 称 为 流 。Haskell 提供 了 一 个 与 外 界 交 互 的 函数 : 


interact :: ([Char] -> [Char]) -> I0 () 


interact 的 参数 是 一 个 函数 ， 其 输入 是 来 日 标准 输入 的 潜在 无 穷 的 字符 列表 ， 并 返回 打 
印 在 标准 输出 的 一 个 潜在 无 穷 的 字符 列表 。 例 如 : 


ghci> import Data.Char 
ghci> interact (map toUpper) 
hello world! 

HELLO WORLD! 

Goodbye, cruel world! 
GOODBYE, CRUEL WORLD! 
{Interrupted} 


首先 输入 库 Data .Char 以 便 可 以 使 用 toUpper， 然 后 创建 一 个 将 每 个 字符 转换 为 大 写 
的 交互 。 每 次 输入 一 行 (重复 出 现在 显示 各 上 )， 交 互 程序 输出 全 部 大 写 的 输入 行 。 该 进 
程 连续 运行 直至 用 户 中 断 它 。 

也 可 以 设计 一 个 终止 的 交互 。 例 如 : 

interact (map toUpper . takeWhile (/= '.')) 
该 程序 实现 类 似 于 以 上 的 交互 ， 而 且 当 输入 行 键入 句点 后 立即 终止 : 

ghci> interact (map toUpper . takeWhile (/= '.')) 


Goodbye. Forever 
GOODBYE 


下 面 是 一 个 能 够 独立 运行 的 程序 ， 它 读 取 一 个 Haskell 文学 型 程序 作为 输入 ， 然 后 返 
回 将 首 字符 不 是 > 的 非 空 行 删除 ， 其 余 行 的 首 字 符 > 被 删除 的 文件 。 所 以 结果 是 一 个 合 


227 | 


228 | 


了 92 第 9 章 


的 .hs 文件 〈 非 文学 型 的 Haskell 脚本 ) : 


main = interact replace 

replace = unlines . map cleanup . filter code . lines 
code xs = null xs || head xs == '>! 

cleanup xs = if null xs then [] else tail xs 


该 程序 是 与 标识 符 main 相关 联 的 计算 ， 而 且 任 何 程序 如 果 要 进行 编译 ， 必 须 给 出 main 
的 定义 。 函 数 1ines 将 文本 分 解 成 行 ，unlines 在 这 些 行 间 添 加 换行 符 后 重新 将 其 合成 
文本 。 如 果 将 程序 存储 为 1hs2hs.1lhs， 和 那么 可 以 将 其 编译 ， 然 后 运行 : 

$ ghc lhs2hs.lhs 

$ lhs2hs <myscript.lhs >myscript.hs 
其 中 第 二 行 的 输入 来 自 myscript .lhs， 输 出 重 定 问 到 myscript.hs。 

在 Haskell 早期 版 本 中 ， 基 于 流 的 交互 是 与 外 界 交 互 的 主要 方法 。 但 是 ， 以 上 解释 的 
模型 对 于 大 多 数 实 际 程序 设计 来 说 过 于 简单 。 在 更 实际 的 应 用 中 ， 需 要 比 从 键盘 读 字 符 和 
在 屏幕 上 写字 符 更 多 的 交互 。 例 如 ， 需 要 打开 文件 并 读 文 件 、 写 文件 ， 或 者 删除 文件 ， 总 
之 需要 与 一 个 函数 语言 范围 之 外 的 所 有 设备 和 机 制 交 互 。 交 互 是 实时 发 生 的 ， 程 序 员 必须 
正确 地 处 理 交 互 事 件 发 生 的 次 序 。 在 基于 流 的 模型 中 ， 事 件 的 次 序 用 列表 中 元 素 的 次 序 表 
示 。 换 言 之 ， 次 序 在 数据 中 表达 ， 基 本 没有 反映 在 程序 编写 的 方式 上 。 第 10 革 将 考虑 为 
一 种 交互 的 方法 一 一 一 种 能 真正 用 于 控制 事件 序列 顺序 程序 的 通用 方法 。 使 用 这 种 方法 
时 ， 事 件 的 次 序 显 式 地 反映 在 程序 的 编写 方式 中 。 


9.6 双向 链表 


下 面 用 循环 列表 的 另 一 个 应 用 结束 本 章 。 设 想 阅 读 由 页 的 非 空 列 表 组 成 的 一 本 书 。 在 
书 中 浏览 时 ， 需 要 有 移 到 下 一 页 或 者 翻 到 前 一 页 的 方法 。 其 他 的 浏览 工具 也 是 有 用 的 ， 不 
过 这 里 只 考虑 这 两 种 方法 。 下 面 是 与 一 本 无 聊 的 只 由 3 页 构成 的 书 的 交互 过 程 : 

ghci> start book 

"Page 1" 

ghci> next it 

"Page 2" 

ghci> prev it 

"Page 1" 

ghci> next it 

"Page 2" 

ghci> next it 

"Page 3" 
在 CHCi 中 变量 it 被 绑 定 到 刚刚 在 提示 符 后 键 人 的 表达 式 上 。 展 开 一 本 书 时 ， 打 印 出 来 
的 是 第 一 页 。 翻 到 下 一 页 ， 然 后 返回 前 一 页 。 有 趣 的 问题 是 ， 当 我 们 已 经 在 最 后 一 页 时 ， 
翻 到 下 一 页 应 该 如 何 处 理 ? 浏览 程序 应 该 报错 ， 仍 然 停 留 在 最 后 一 页 ， 还 是 转 到 第 一 页 ? 
假如 选择 后 者 ， 最 后 一 页 的 下 一 页 是 第 一 页 ， 第 一 页 的 前 一 页 是 最 后 一 页 。 换 言 之 ， 书 是 
循环 双 链 表 (cyclic doubly-linked list) 的 一 个 例子 。 

下 面 是 有 关 数 据 类 型 的 声明 : 


data DList a = Cons a (DList a) (DList a) 


elem :: DList a -> a 
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elem (Cons ap n) = a 


prev,next :: DList a -> DList a 
prev (Cons ap n) = P 
next (Cons ap n) = 


打印 双 链 表 通 过 显示 当前 元 素来 完成 : 


instance Show a => Show (DList a) 
where show d = show (elem d) 


这 样 一 来 ， 上 面 提 到 的 书 就 是 一 个 3 页 列表 [pl ,p2,p3] ， 其 中 : 


pi = Cons "Page 1" p3 p2 
= Cons "Page 2" pl p3 
p3 = Cons "Page 3" p2 pi 


这 个 例子 表明 将 一 个 〈 非 空 ) 列表 as 转换 为 双 链 表 的 函数 mkCDList :: [a] -> 
DList a 可 以 说 明 为 一 个 双 链 表 的 有 穷 列表 xs 的 第 一 个 元 素 ， 并 且 满 足下 列 3 个 性 质 : 


map elem XS = as 
map prev xs = rotr xs 
map next xs = rotl xs 


其 中 rotr 和 rotl (分 别 是 右 转 rotate right 和 左 转 rotate left 的 简写 ) 定义 如 下 : 


rotr xs = [last xs] ++ init xs 
rotl xs = tail xs ++ [head xs] 


注意 现在 对 于 任意 双 链 表 的 列表 xs ， 有 


XS = ZipWith3 Cons 
(map elem xs) (map prev xs) (map next xs) 


其 中 zipWith3 的 功能 如 zipwith， 只 是 现在 它 需 要 取 3 个 列表 ， 而 不 是 2 个 列表 。 标 
准 引导 库 的 定义 为 
ZipWith3 f (x:xs) (y:ys) (Z:ZS) 


=fxYy Zz : ZipWith3 f xs ys zs 
zipWith3 . ~_ -= 口 


稍 后 将 看 到 为 一 个 定义 。 可 以 用 归纳 法 证 明 前 面 的 断言 ， 对 于 无 定义 值 和 空 列表 显然 成 
oy 对 于 归纳 情况 ， 推理 如 下 : 

= {因为 xs 是 双 链 表 } 

Cons (elem x) (prev x) (next x):xs 

= {归纳 假设 } 

Cons (elem x) (prev x) (next x): 


(zipWith3 Cons 
(map elem xs) (map prev xs) (map next xs)) 


= {zipWith3 和 map 的 定义 } 
ZipWith3 Cons 
(map elem (x:Xs)) (map prev (x:xs)) (map next (x:xs) 


结合 这 个 结果 与 双 链 表 的 说 明 ， 得 到 


mkCDList as = head xs 
Where xs = ZipWith3 Cons as (rotr xs) (rotl] xs) 


734 第 9 章 


这 个 定义 涉及 一 个 循环 列表 xs。 这 样 可 行 吗 ? 答案 是 “不 可 行 ” 。 原 因 是 如 上 定义 的 
zipWith3 太 勤 奋 。 需 要 使 它 懒 一 点 ， 当 为 外 两 个 列表 不 是 真正 需要 时 不 对 它们 
求 值 : 
ZipWith3 f (x:xs) ys zs 
= f x (head ys) (head zs): 
ZipWith3 f xs (tail ys) (tail zs) 
zipWith3 _ ~ ~_ .=[] 


定义 这 个 函数 的 一 个 等 价 方法 是 利用 Haskell 的 无 争辩 模式 (irrefutable pattern ) : 


ZipWith3 f (x:xs) “(y:ys) “(Z:ZS) 
= 二 XyZ : ZipWith3 f xs ys zs 
ZipWith3 .= == 间 


无 争辩 模式 用 一 个 波浪 号 表示 ，~ (x:xs) 的 匹配 是 惰性 的 ， 即 匹配 是 在 x 或 者 xs 
被 需要 时 才 进行 。 
为 了 确保 以 上 使 用 zipwith3 修改 版 的 mkcDList 定义 确实 取得 进展 ， 令 xse = 上 ， 
并 且 令 
XS ii = ZiBWIiIth3 Cons "A" (FOtr Xx5,)(rotl xs,) 


然后 xsi 如 下 : 


ZiDWIith3 CoOons tA LI 由 
= [Cons 'A' 1 |] 


XS 如 下 : 
ZipWith3 Cons "A" 
[Gons "A" 上 目 站 ] [Gons "A 渍 十 ] 
= [GONns MAGons A 上 上 LY teons “A LL 4).) 
所 oO 
和 
9.7 习题 


习题 A” 给 定 3 个 严格 递增 的 列表 xs、ys 和 zs， 则 有 


merge (merge xs ys) ZS} = merge xs (merge ys zs) 


因此 ，merge 满足 结合 律 。 男 外 假定 xs、ys 和 zs 的 第 一 个 元 素 是 严格 递增 的 ， 那 么 
还 有 

xmerge (xmerge xs ys) ZS = xmerge XS (xmerge ys ZS) 
由 此 是 否 可 以 推出 表达 式 foldr1l xmerge multiples 中 的 foldr1 可 以 用 fold11 
代替? 

习题 B ”标准 引导 库 图 数 cycle :: [al -> [a] 取 一 个 列表 xs， 返回 xs 元 素 的 无 
穷 次 重复 列表 。 如 果 xs 是 空 列表 ， 那 么 cycle [] 返 回 错误 信息 。 例 如 : 


cycle "hallo" = "hallohallohallo... 


请 使 用 一 个 循环 列表 定义 cycle， 确保 该 定义 在 空 列表 、 有 穷 列表 和 无 穷 列表 上 都 
可 行 。 
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习题 C” 斐 波 那 契 函数 定义 如 下 : 


fib n = fib (n-1) + fib (n-2) 


请 用 一 行 定义 写 出 能 够 生成 翡 波 那 契 数列 的 无 穷 列表 fibs。 

习题 D 一 个 源 于 数学 家 W. R Hamming 的 有 名 问题 是 设计 一 个 程序 ， 该 程序 能 够 生 
成 一 个 数 的 无 穷 列 表 ， 并 且 满 足 性 质 : ( 1 ) 列表 严格 递增 ; 《〈i) 列表 从 1 开始 ; 
(下 ) 如 果 列 表 包 含 数 x， 那 么 列表 也 包含 2x、3x 和 5x; (1V) 列表 不 含 其 他 数 。 因 此 ， 
列表 以 下 列 这 些 数 开 始 : 

1.2.345.68.9.10 12 过 , 16” 

请 给 出 生成 这 个 列表 hamming 的 定义 。 

习题 E 证 明 approx n xs Exs 对 于 所 有 的 n 都 成 立 。 然 后 证 明 如 果 approx n xs 
ys 对 所 有 的 n 成 立 ， 那么 xs Eys。 因 此 可 以 得 出 如 下 结论 : 

lim approx ni xs = XS 

习题 F 给 出 断言 的 反例 : 如 果 对 于 所 有 的 n 有 xs!! n = ys!! n, 那么 xs =ys。 

习题 G 证 明 iterate fx = x: map f (iterate f x)。 

习题 H 在 primes 的 循环 列表 定义 中 ， 是 否 可 以 用 定义 


mergeAll = foldr xmerge [|] 


来 替代 书 中 的 定义 ? 
习题 | 回顾 定义 : 


prs n = approx n (2:([3..] \\ crs n)) 
crs n = mergeAll [map (p*) [p..] | p <- prs n] 


假定 prs n =pi: Py: …: p,: 上 ， 其 中 pj 是 第 j 个 素数 ,请 说 明 如 何 证 明 crs n = 
c: CG: …: cn: 上 ， 其 中 c 是 第 j 个 合 数 (如 c=4)， 而 且 m=p。 给 出 证 明 梗概 即 可 。 
由 此 证 明 primes 确实 可 以 生成 素数 的 无 穷 列 表 。 

9.3 节 曾 经 讲 过 ，primes 的 第 并 个 通 近 primes, 不 等 于 approx n primes。 事 实 


上 ， 有 
primes4=2:3:5:7:…:47: 上 | 
请 问 primess 生成 什么 ? 


习题 」 男 一 种 生成 素数 的 方法 是 所 谓 的 Sundaram 和 法 ， 是 数学 家 S. P，Sundaram 在 
1934 年 发 现 的 : 

primes = 2:[2*n+1 | n <- [1..] \\ sundaram] 

sundaram = mergeAll [[i+j+2*i*j | j <- [i..]] | i <- [1..]] 

要 证 明 primes 定义 中 的 列表 概括 恰好 生成 奇 素数 ， 只 需 证 明 2n +1 永远 不 是 合 数 ， 
也 就 是 说 它 永 远 不 会 分 解 成 (2i+1)(2+1)， 其 中 i 和 j 是 正 整数 。 为 什么 ? 

习题 K ”定义 函数 所 上 ) =0， 如 果 x#F 上 ， 则 拟 x) =1， 这 样 定 义 的 函数 /是 可 计算 的 
吗 ? 如 果 定 义 一 个 函数 对 于 所 有 有 穷 列表 和 非 完 整 列 表 返 回 上 ， 对 于 所 有 无 穷 列 表 返 回 1， 
这 样 的 函数 可 计算 吗 ? 
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习题 L 一 个 圆 环 (torus) 是 一 个 双 循 环 的 双 癌 双 链 表 。 它 在 左右 方向 是 循环 双 链 
表 ， 而且 上 下 方向 也 是 循环 双 链 表 。 将 矩阵 表示 为 一 个 长 度 为 m 的 列表 ， 列 表 的 每 个 元 素 
又 都 是 长 度 为 n 的 列表 ， 构造 下 列 定义 : 


mkTorus :: Matrix a -> Torus a 


其 中 : 


data Torus a = Cell a (Torus a) (Torus a) 
(Torus a) (Torus a) 

elem (Cell audlr)=a 

up (Cell audlr)=u 

down (Cell audl1l rr) 

laft 《Call a u G1 'r) 

right (Cell audl1 rr) 


定义 看 似 复 杂 ， 但 是 答案 简短 得 令 人 惊奇 。 


d 
1 
r 


9.8 答案 


习题 A 答案 不 可 以 ， 因 为 对 于 任意 无 穷 列表 xs, foldll f xs = undefined,。 
习题 B 答案 定义 是 


Cycle [] = error "empty list" 
Cycle xs = ys Where ys = xs ++ ys 


注意 ， 如 采 xs 无 穷 ,那么 xs ++ ys = xs, 所 以 cycle 是 无 穷 列表 上 的 恒 等 
负数 。 
习题 C 答案 ”单行 定义 是 
fibs :: [Integer] 
fibs = 0:1:zipWith (+) fibs (tail fibs) 
习题 D 答案 
hamming :: [Integer] 
hamming = 1: merge (map (2*) hamming) 
(merge (map (3*) hamming) 
(map (5*) hamming)) 
习题 E 答案 ”对 n 用 归纳 法 证 明 approx n xs 5 xs。 基 本 情况 容易 验证 ， 但 是 归纳 
情况 需要 进一步 对 xs 做 子 归 纳 。 子 归纳 的 基 情 况 ( 空 列表 和 无 定义 列表 ) 容易 验证 ， 归 
纳 步 又 如 下 : 
approx (n+1) (x:xs) 
“ 
Xx:approx n xs 


C {(x:) 的 单调 性 和 归纳 假设 } 


和 ,和 XS. 


下 面 命题 的 证 明 可 以 对 xs 归纳 。 


(yn : approx n xs Cys)—>xsCys 


对 于 无 定义 和 空 列 表 是 显然 的 ， 对 于 归纳 情况 ， 根 据 approx 的 定义 和 列表 上 的 逼近 序 有 


无 穷 列表 i 


(Vn:approx n (x:xs) Cys) 
>xsChead ysA\(Vn:approx n xs Ctail ys) 


根据 归纳 假设 有 


x:xXxs CL head ys:tail ys=ys 


由 此 根据 极限 的 定义 得 到 


hm approx n xs = XS 
n—%% 


习题 F 答案 ”两 个 列表 repeat undefined 和 undefined 不 相等 ， 但 是 


(repeat undefined)!!n=undefined! !n 


对 于 所 有 n 成 立 ， 因 为 两 边 都 是 上 。 235 | 
习题 G 答案 ”必须 证 明 对 于 所 有 的 自然 数 n 有 下 列 等 式 : 


approx n (iterate f x) = approx n (x:map f (iterate f x)) 


这 个 断言 可 以 由 下 列 等 式 推出 : 
approx n (iterate f (f x)) 
= approx n (map f (iterate f x)) 


该 等 式 可 以 对 n 归纳 证 明 。 对 于 归纳 情况 ， 化 简 两 边 。 
对 于 左边 的 化 简 ; 
approx (n+1) (iterate f (f x)) 
= {iterate 的 定义 } 
approx (n+1) (f x:iterate f (f (f x))) 
= {approx 的 定义 } 
f x: approx n (iterate f (f (f x))) 
= {归纳 假设 } 


f x: approx n (map f (iterate f (f x))) 
对 于 右边 的 化 简 

approx (n+1) (map f (iterate f x)) 
= {iterate 和 map 的 定义 } 

approx (n+1) (f x:map f (iterate f (f x))) 
= {approx 的 定义 } 

f x: approx n (map f (iterate f (f x))) 
习题 H 答案 是 的 ， 因 为 


foldr xmerge [ (xs:undefined) = xmerge xs undefined 


而 且 右 边 以 xs 的 第 一 个 元 素 开 始 。 

习题 | 答案 证 明 用 归纳 法 。 必 须 首先 证 明 crs (n +1) 是 cl: c: …: cn: 上 与 [236| 
的 倍数 无 穷 列 表 忆 ,Pi， 忆 (Pi +1)，… 归 并 的 结果 ,其 中 m=p;。 由 此 给 出 了 直至 
pn41 的 所 有 合 数 。 最 后 ， 需 要 证 明 p,,, <p?,1。 

部 分 列表 primes;s 生成 所 有 小 于 2209 =47 x47 的 素数 。 

习题 J 答案 ”因为 奇 整数 具有 2m +1 的 形式 ， 其 中 必 形 如 i++27， 那 么 该 数 被 排除 
在 最 后 列表 之 外 。 但 是 


231 
: 
238 
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2(2 二 于 22 1 = (2+127 +1 
习题 K 答案 不 是 , /不 是 单调 的 : LE1， 但 是 所 上 ) EfA(1)。 对 于 第 二 个 函数 〈( 称 
为 g)， 有 xs Eys 意味 着 g(xs)sg(ys)， 所 以 g 是 单调 的 。 但 g 不 是 连续 的 ， 故 不 可 
计算 。 
习题 | 答案 定义 为 
mkTorus ass = head (head xss) 
Where xss = ZipWith5 (zipWith5 Cell) 
ass (rotr xss) (rotl xss) 
(map rotr xss) (map rotl xss) 
其 中 rotr 和 rot1 对 和 矩阵 的 行 做 旋转 ,map rotr 和 map rot1 对 矩阵 的 列 做 旋转 。 铬 
数 zipWiths 的 定义 必须 对 于 后 4 个 参数 是 严格 的 。 


9.9 注 记 


Melissa 0” Neill 撰写 了 有 关 生 成 素数 的 好 文章 ,参见 “The genuine sieve of Era- 
tosthenes” ,Journal of Functional Programming 19(1),，,95-106，2009。Ben Sijtsma 的 博士 论 
文 Verification and derivation of infinite-list programs ( University of Groningen, the Netherlands, 
1988) 研究 无 穷 列表 程序 的 各 种 特性 ， 而 且 给 出 对 这 种 程序 进行 推理 的 技术 ， 其 中 有 一 草 
介绍 石头 -剪刀 - 布 的 公平 性 证 明 。 

我 的 论文 “On building cyclic and shared data structures in Haskell” 包 含 更 多 关于 无 穷 
列表 和 循环 列表 应 用 的 例子 ， 参 见 Formal Aspects of Computing 24(4-6 ) ，609-621，jJuly 
2012。 也 请 在 下 列 链接 参阅 文章 “ 打 结 ”(Tying the knot) 

haskell. org/ haskellwiki/ Tying_the_Knot 

Hamming 问题 在 图 数 式 程序 设计 早期 一 下 用 于 循环 程序 的 展示 。 
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第 2 音 描 述 了 函数 putStrLn 是 一 个 Haskell 命令 (command) ，IO a 是 与 外 界 交 互 
的 输入 -输出 计算 的 类 型 ， 并 返回 一 个 类 型 a 的 值 ， 还 提 到 一 个 表示 命令 顺序 执行 的 语 
法 ， 称 为 do 语法 ( do-notation)。 本 章 详 细 解 释 这 些 术语 的 含义 ， 并 介绍 一 种 新 的 程序 设 
计 方 法 ， 称 为 单子 (monadic) 程序 设计 。 单 子 程序 提供 了 与 外 界 交 互 的 简单 且 顾 具 吸 引 
力 的 方法 ， 而 且 这 种 程序 的 能 力 远 不 止 于 此 : 它 提供 了 解决 一 类 问题 的 简单 顺序 机 制 ， 包 
括 异 常 处 理 、 破 坏 性 数组 更 新 、 语 法 分 析 和 基于 状态 的 计算 。 单 子 式 程序 使 得 人 们 能 够 用 
果 数 程序 实现 诸如 Python 和 C 等 命令 式 程序 ， 具 有 非常 实用 的 意义 。 


10. 1 IO 单子 


类 型 To a 是 第 2 章 所 述 的 一 个 抽象 数据 类 型 ， 所 以 不 知道 它 的 称 为 动作 (action) 或 
者 命令 的 值 是 如 何 表 示 的 。 但 是 ， 可 以 将 这 个 类 型 想象 成 


type I0 a = World -> (a,World) 


因此 ， 一 个 动作 是 一 个 函数 ， 其 输入 是 一 个 世界 ， 输 出 是 一 个 类 型 a 的 值 以 及 一 个 新 
的 世界 。 然 后 这 个 新 的 世界 可 以 作为 下 一 个 动作 的 输入 。 因 为 输入 -输出 动作 改变 着 当前 
世界 ， 所 以 不 能 返回 到 旧 世 界 ， 也 不 能 重复 这 个 世界 或 者 查看 其 组 成 。 所 能 做 的 只 有 用 给 
定 的 原始 动作 在 世界 上 进行 操作 ， 将 这 些 动作 用 茶 种 顺序 组 合 起 来 。 

一 个 原始 动作 是 打印 一 个 字符 : 


putChar :: Char -> I0 () 


当 该 动作 被 执行 时 ， 一 个 字符 被 打印 在 标准 输出 上 ， 通 常 是 计算 机 屏幕 。 例 如 : 

ghci> putChar '‘'x' 

xghci> 

字符 x 被 打印 在 屏幕 上 ， 没 有 别 的 事情 发 生 ， 所 以 GHCi 的 下 一 个 提示 符 紧 接 在 x 后 
面 ， 没 有 空格 ， 也 没有 换行 。 执 行 这 个 动作 不 产生 有 价值 的 值 ， 所 以 返回 值 是 零 元 组 ()。 

男 一 个 原始 动作 是 done : : IO () ， 该 命令 不 做 任何 事情 ， 它 不 改变 当前 世界 ， 并 返 
回 零 元 组 ( ) 。 

顺序 组 合 动作 的 一 个 简单 运算 是 ( >> ) ， 其 类 型 是 


(>) :3 IO () -> I0 () => IO © 


给 定 动作 p 和 q， 动作 p >> qa 首先 完成 动作 P， 然 后 完成 动作 q。 例 如 : 


ghci> putChar 'x’'’ >> putChar '\n' 
x 
ghci> 


这 次 在 x 之 后 打印 了 换行 。 利 用 ( >> ) 可 以 定义 函数 putstrLn: 
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putStrLn :: String: -> IO () 
PutStrLn xs = foldr (>>) done (map putChar xs) >> 
putChar '\n' 
该 动作 打印 一 个 串 的 所 有 字符 ， 然 后 用 一 个 换行 符 结束 。 注 意 map putChar xs 是 一 个 
动作 列表 。 我 们 仍然 在 函数 式 程序 设计 的 世界 ， 它 的 所 有 表达 能 力 ， 包括 map 和 foldr 
都 是 可 以 使 用 的 。 
下 面 是 另 一 个 原始 动作 : 


getChar :: IO Char 


这 个 动作 被 执行 时 ， 从 标准 输入 设备 读 取 一 个 字符 。 标 准 输入 设备 的 输入 是 用 户 在 键盘 上 
键入 的 字符 ， 所 以 get char 返回 用 户 键入 的 第 一 个 字符 。 例 如 : 


ghci> getChar 
x 
ie! 


键入 getchat ， 再 按 回 车 后 ，GHCi 等 待 用 户 建 入 一 个 字符 。 键 入 'x' (键入 时 该 字符 同 
时 显示 出 来 ) ， 然 后 该 字符 被 读 取 ， 接 着 打印 出 来 。 

done 的 推广 是 不 做 任何 事情 ， 并 返回 一 个 给 定 值 的 动作 : 

return :: a -> IO a 

特别 是 ，done = return ()。( >> ) 的 推广 具有 下 列 类 型 . 


(>>) :; IO a -> I0 b -> I0'b 


给 定 动作 p 和 q， 动作 pp >> q 先 完成 动作 p， 丢 弃 该 动作 返回 的 值 ， 然 后 完成 动作 
do 例如 : 

ghci> return 1 >> return 2 

2 


显然 ， 这 个 动作 只 能 用 于 对 p 返回 的 值 不 感 兴趣 的 情况 ， 因 为 q 没有 办 法 依赖 于 这 个 什 。 
人 们 真正 需要 的 是 一 个 更 通用 的 具有 如 下 类 型 的 运算 ( >>= ) : 


(Su) 1 IO a =>: (a => I0. 示 => IO bb 


使 用 该 运算 得 到 的 组 合 b >>= f 是 一 个 动作 : 该 动作 被 执行 时 ， 首 先 完成 5p， 返回 类 型 a 
的 值 x， 然 后 完成 动作 £ x， 最 后 返回 一 个 类 型 b 的 值 y。 很 容易 用 ( >>=) 定义 ( >>)， 
将 此 留 作 练习 。 运 算 ( >>= ) 通常 称 为 绑 定 (bind) ， 不 过 也 将 其 读 作 “然后 应 用 ”。 

利用 ( >>=) 可 以 定义 一 个 函数 getLine ， 用 于 读 取 一 行 输入 ， 更 确切 地 说 ， 读 取 一 
个 字符 列表 ， 直 至 第 一 个 换行 符 ， 但 不 包括 该 换行 符 : 

getLine :: IO String 

getLine = getChar >>= £ 

Where f x = if x == '\n' then return [] 


else getLine >>= 区 
Where g xs = return (x:xs) 


这 个 定义 的 含义 很 直观 : 取得 第 一 个 字符 x， 如 果 x 是 换行 符 ， 则 返回 空 列表 ; 否则 取得 该 
行 的 其 他 字符 ， 然 后 将 x 添加 在 其 前 面 。 尽 管 解读 很 直接 ， 但 是 定义 中 舱 套 where 于 句 的 
使 用 有 点 难 懂 。 一 种 改进 定义 可 读 性 的 方法 是 使 用 匿名 兰 姆 达 表 达 却 与 成 : 
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getLine = getChar >>= \x -> 
if x == '\n! 
then return [] 
else getLine >>= \xs -> 
return (x:xs) 


男 一 种 更 好 的 方法 是 使 用 do 记 法 : 
getLine = do x <- getChar 
if x == '\n' 
then return [] 
else do xs <- getLine 
return (x:xs) 


定义 右边 使 用 了 Haskell 格式 惯例 。 特 别 要 注意 条 件 表达 式 的 缩 进 ， 而 且 最 后 一 个 return 的 
缩 进 表示 它 属 于 最 里 那个 do 的 动作 。 用 程序 设计 者 的 观点 来 说 ， 最 好 使 用 花 括号 和 分 号 明 
确 标 示 格 式 : 


getLine = do {x <- getChar; 
if x == '\n! 
then return [] 
else do {xs <- getLine; 
return (x:xs)}} 


后 面 还 会 讨论 do 记 法 。 

Haskell 库 System. I 了 IO 提供 了 putchar 和 getchar 之 外 的 许多 其 他 动作 ， 包 括 打 开 
文件 和 读 文 件 、 写 文件 和 关闭 文件 、 各 种 方式 的 缓存 输出 ， 等 等 。 本 书 不 介绍 这 些 动作 的 详 
情 。 但 是 , 或 许 有 两 点 需要 解释 。 第 一 点 ， 不 存在 类 型 To a -> a 的 函数 ”。 一 旦 进入 完成 
输入 -输出 动作 的 世界 ， 必 须 采 在 这 个 世界 里 ， 不 能 出 来 。 为 了 说 明 必 须 这 样 规定 的 原因 ， 
假设 有 了 肾 数 runIO， 并 考虑 下 列 定义 : 


int 3s: Int 
int =x-y 
Where X = runI0 readInt 
y = TunIO readInt 


readInt = do {xs <- getLine; return (read xs :: Int)} 


动作 readInt 读 取 一 行 输入 ， 只 要 输入 只 含 数 字 ， 就 将 其 解释 为 一 个 整数 。 那 么 ， 现 
在 int 的 值 是 什么 ? 答案 完全 取决 于 x 和 y 哪个 先 得 到 求 值 。Haskell 没有 预先 规定 在 表达 
式 x-y 中 x 是 否 在 y 之 前 先 求 值 。 换 名 话说 ; 输入 -输出 动作 必须 用 确定 的 方式 顺序 进 
行 ， 而 且 Haskell 是 惰性 函数 语言 ， 很 难 确 定 其 中 事情 发 生 的 次 序 。 当 然 ， 表 达 式 如 x -y 是 
一 个 非常 简单 的 例子 (在 命令 式 语言 中 同样 不 期 望 的 事情 也 会 出 现 ) ,但 是 可 以 想象 提供 这 
样 的 函数 runIo 将 带 来 的 混乱 。 

第 二 点 ， 或 许 是 应 该 讲 给 那些 对 于 如 下 表达 式 漫不经心 的 读者 : 


undefined >> return 0 :: IO Int 


这 个 代码 引起 错误 还 是 返回 0? 答案 是 “一 个 错误 ”。IO 在 下 列 意 义 下 是 严格 的 : IO 动作 是 
按照 顺序 完成 的 ， 即 使 后 续 的 动作 可 能 不 在 意 前 面 动作 的 返回 值 。 


日 ”实际 上 存在 这 样 的 函数 ， 称 为 unsafePerformrO， 但 它 是 一 个 很 不 安全 的 函数 。 
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返回 本 节 主 题 ， 总 结 一 下 。 类 型 To a 是 一 个 抽象 数据 类 型 ， 在 该 类 型 上 至 少 可 以 使 用 


下 列 运算 : 
return :: a -> I0 a 
(>>=) :: IO a -> (a -> IO b) -> IO b 


putChar :: Char -> I0 () 

getChar :: I0 Char 
后 两 个 函数 是 特定 于 输入 和 输出 的 ,但 是 前 两 个 函数 则 不 然 。 实 际 上 它们 是 刻画 单子 类 族 的 
通用 顺序 运算 : 


class Monad m where 
reOtUrn :: a& -> ma 
(>>=) :: ma -> (a ->mb) ->mb 


两 个 单子 运算 需要 满足 茶 些 定律 ， 将 会 在 适当 的 时 候 说 明 是 哪些 定律 。 至 于 名 称 “ 单 
子 ” 的 来 源 ， 它 是 从 哲学 中 偷 来 的 ， 或 者 说 是 从 莱 布 尼 效 那里 偷 来 的 ， 而 莱 布 尼 效 是 从 希腊 
哲学 中 借 来 的 。 请 勿 深究 这 个 名 词 。 


10.2 更 多 的 单子 


如 果 单 子 仅仅 要 求 这 些 ， 是 否 一 定 有 很 多 单子 ? 是 的 ， 确 实 如 此 。 特 别 是 ， 谦 逊 的 列表 
类 型 是 一 个 单子 : 


instance Monad [] where 
return x = [x] 
xS >>= f = concat (map f xs) 


当然 ， 还 不 清楚 单子 运算 应 该 满足 什么 定律 ， 所 以 也 许 这 个 实例 定义 不 正确 (是 正确 
的 ), 但是， 至少 运 算 的 类 型 是 正确 的 。 因 为 do 记 法 可 用 于 任何 单子 ， 所 以 ， 可 以 用 新 的 语 
法 定义 函数 ， 如 笛 卡 儿 积 函数 cp :: [[a]] -> [[al] (参见 7.3 节 )， 


cp [] = return [] 

cp (xs:xss) = do {x <- xs; 
ys <- cp Xxss; 
return (x:ys)} 


比较 第 二 个 子 名 的 右边 与 下 列 列表 概括 : 


[x:ys | x <- xs, ys <- cp Xxss] 


可 以 看 出 ， 这 两 个 写法 非常 相似 ， 唯 一 的 真正 区 别 是 在 do 记 法 中 结果 出 现在 最 后 ， 而 
不 是 在 开始 。 如 果 在 列表 概括 前 引入 了 单子 和 do 记 法 ， 也 许 后 者 的 列表 概括 就 不 需 
了 

下 面 是 另 一 个 例子 。 类 型 Maybe 是 一 个 单子 : 


instance Monad Maybe where 


return Xx = Just x 
Nothing >>= f = Nothing 
Just x >>= f =fx 


为 了 欣 党 这 个 单子 市 来 的 便利 ， 考 虑 Haskell 库 函 数 : 


lookup :: Eq a => a -> [(a,b)] -> Maybe b 
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如 果 (x,y ) 是 列表 alist 中 第 一 个 分 量 为 x 的 二 元 组 的 首次 出 现 ， 那 么 lookup x alist 
的 值 是 Just y; 如 果 不 存在 这 样 的 二 元 组 ， 则 其 值 为 Nothing。 设想 在 列表 alist 中 
查找 x， 然 后 在 第 二 个 列表 blist 中 查找 结果 y， 接 着 继续 在 第 三 个 列表 clist 中 查找 
结果 z。 如 果 这 些 查找 中 任何 一 个 查找 返回 Nothing， 那 么 最 后 结果 是 Nothing。 定 义 
这 个 图 数 ， 必 须 用 类 似 下 面 的 式 子 来 表达 : 


case lookup x alist of 
Nothing -> Nothing 
Just y -> case lookup y blist of 
Nothing -> Nothing 
Just Z -> lookup z clist 


利用 单子 ， 可 以 如 下 定义 : 


do {y <- lookup x alist; 
Z <- lookup y blist; 
lookup z clist} 


代 之 以 显 式 地 写 出 计算 链 ， 而 且 每 个 计算 可 能 返回 Nothing， 并 将 Nothing 显 式 地 在 计 
算 链 中 传递 ， 可 以 把 定义 写成 简单 的 单子 表达 式 ， 其 中 Nothing 的 处 理 是 在 单子 中 隐 式 
地 进行 的 。 


do 记 法 


就 像 列 表 概 括 可 以 翻译 成 map 和 concat 的 表达 式 ，do 表达 式 也 可 以 翻译 成 用 
return 和 和 绑 定 表示 的 表达 式 。 三 个 主要 翻译 规则 如 下 : 


do {p} si 天 
do {p;stmts} = P >> do {stmts} 
do {x <- p;stmts} = P >>= \x -> do {stmts} 


在 这 些 规则 中 p 表示 一 个 动作 ， 所 以 第 一 个 规则 表示 单个 动作 旁 的 do 可 以 去 掉 。 第 二 个 
和 第 三 个 规则 中 的 stmts 是 一 个 语句 的 非 空 序列 ， 其 中 每 个 语句 或 者 是 一 个 动作 ， 或 者 
是 一 个 形 如 x <- P 的 语句 。 后 者 不 是 一 个 动作 ， 所 以 下 面 的 表达 式 不 是 语法 正确 的 : 


do {x <- getChar} 


顺便 说 明 的 是 ， 空 的 do 表达 式 do { } 也 不 是 语法 正确 的 。 一 个 do 表达 式 的 最 后 一 个 语 
句 必须 是 一 个 动作 。 
男 一 方面 ， 下 面 两 个 表达 式 都 是 正确 的 : 


do {putStrLn "hello "; name <- getLine; putStrLn name} 
do {putStrLn "hello "; getLine; putStrLn "there"} 


第 一 个 例子 打印 一 个 问候 ， 然 后 读 取 一 个 名 ， 并 完成 问候 。 第 二 个 例子 打印 一 个 问候 ， 读 
取 一 个 名 ,但 是 即刻 忘记 该 名 ,然后 用 “there” 结 束 问候 。 两 个 例子 有 点 像 生活 中 一 
个 人 被 介绍 给 为 一 个 人 的 情景 。 

最 后 ， 由 以 上 的 翻译 规则 ， 可 以 证 明 以 下 两 个 规则 : 


do {do {stmts}} = do {stmts} 
do {stmtsi; do {stmts2}} = do {stmtsi; stmts2} 


但 是 ， 对 于 散 套 的 do 必须 小 心 : 
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do {stmtsi1; 
if P 
then do {stmts2} 
else do {stmts3}} 


如 果 stmts2 和 stmts3 包含 不 止 一 个 动作 ， 则 这 里 的 ao 是 必须 的 。 
单子 定律 

单子 定律 表述 的 仅仅 是 关于 return 和 (>>=) 的 表达 式 的 简化 ， 也 正如 我 们 所 期 
待 的 一 样 。 定 律 共有 三 条 ， 我 们 将 用 三 种 不 同 的 方式 来 叙述 它们 。 第 一 条 定律 表示 re- 
turn 是 ( >>=) 的 右 单位 元 : 

(p >>= return) = p 
这 个 定律 用 do 记 法 表示 为 

do {x <- p; return x} = do {p} 

第 二 条 定律 表示 return 也 是 一 种 左 单位 元 : 

(return e >>= f) = 上 e 
该 定律 用 ao 记 法 表示 为 

do {x <- return e; f x} = do {f e} 

第 三 条 定律 表示 ( >>= ) 是 某 种 意义 上 可 结合 的 : 

((p >>= f) >>= g) = p >>= (\x -> (f x >>= g)) 
该 定律 用 do 记 法 表示 为 

do {y <- do {x <- p; £f x}; 5 y} 


= do {x <- p; do {y <- f x; g y}} 
» do {x <= py <= £ x5 8 7 


最 后 一 行 利用 了 do 记 法 的 消去 散 套 性 质 。 
对 于 第 三 种 表示 单子 定律 的 方法 ， 考 虑 如 下 定义 的 运算 ( >=> ) : 


(>=>) :: Monad m => (a -> m b) -> (b -> m c) -> (a -> m c) 
(f >=> g) x = fx >>=g 


这 个 运算 像 函 数 复合 ， 只 是 复合 的 函数 都 具有 类 型 x -> my， 其 中 x 和 y 是 某 些 适当 的 
类 型 ， 而 且 复 合 的 顺序 是 从 左 至 右 ， 而 不 是 从 右 问 左 。 该 运算 ( 左 到 右 ) 称 为 Kleisli 复 
合 ， 在 Haskell 库 Control .Monad 中 定义 。 也 可 以 定义 对 偶 的 〈 右 到 左 ) Kleisli 复合 : 
(<=<) :: Monad m => (b -> m c) -> (a -> m b) -> (a -> m C) 
其 定义 留 作 练 习 。 
这 里 想 表 达 的 重点 是 ( >>= ) 可 以 用 ( >=> ) 定义 : 
(p >>= f) = (id >=> f) p 
更 简短 的 可 表示 为 ( >>=)= flip (ia >=>)。 男 外 还 有 蛙 跳 (leapfrog) 规则 : 


(f >=> g) . hb = (f .hbh) >=> g 


证 明 留 作 练 习 。 
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用 ( >=>) 来 叙述 的 单子 定律 仅仅 表示 ( >=> ) 有 单位 元 return， 而 且 满 足 结合 
律 。 一 个 集合 与 具有 单位 元 的 且 满 足 结合 律 的 二 元 运算 称 为 一 个 么 半 群 (monoid), “单子 
(monad)” 一 词 可 能 来 自 于 乏 半 群 的 双关 语 。 即 使 如 此 ， 这 确实 是 表述 单子 定律 的 最 简短 
方法 。 

为 一 种 表述 单子 定律 是 有 指导 意义 的 方法 在 习题 中 考虑 。 


10. 3 状态 单子 


如 果 不 是 因为 如 何 解 决 输入 -输出 动作 的 正确 顺序 进行 ， 或许 单子 不 会 出 现在 Haskell 
中 。 但是, 一旦 人 们 理解 了 单子 的 作用 ， 各 种 单子 应 用 很 快 接 中 而 来 。 已 经 看 到 应 用 
Maybe 单子 的 运算 如 何 简 化 涉及 在 一 系列 计算 中 传递 备份 信息 的 计算 链 。 单 子 的 为 一 种 
基本 应 用 是 处 理 可 变 (mnutable) 结构 ， 如 数组 ， 出 于 效率 的 考虑 ， 需 要 能 够 修改 其 值 ， 
因而 在 这 个 过 程 中 破坏 了 它 的 原始 结构 。 

可 变 结构 通过 状态 线程 单子 ST s 引入 ， 该 单子 将 在 10. 4 市 介绍 。 在 介绍 这 个 单子 的 
性 质 之 前 ， 先 考虑 一 个 简单 的 单子 ， 称 为 State s， 该 单子 用 于 处 理 显 式 状态 s。 可 以 将 
类 型 state s a 看 作 下 面 的 函数 : 


type State s a = 8 -> (a,s) 


具有 类 型 state s a 的 动作 输入 一 个 初始 状态 ， 返 回 一 个 类 型 a 的 值 和 一 个 新 的 状态 。 
但 是 ， 想 把 Io a 看 作 State World a 的 同义词 是 错误 的 。State s a 中 的 状态 成 分 s 
可 以 骏 露 ， 也 可 以 被 处 理 ， 但 是 不 能 骏 露 和 处 理 这 个 世界 。 

特别 是 ， 除 了 单子 的 两 个 运算 return 和 ( >>= ) 之 外 ， 状 态 单子 还 有 另外 5 个 运算 : 


put :: 8 -> State s () 

get :: State 8 8 

state :: (8 -> (a,8)) -> State s a 
runState :: State s a -> (s -> (a,B)) 
eValState :: State s a -> 8 -> 8 


图 数 put 将 状态 置 入 一 个 给 定 的 配置 中 ， 而 get 返回 当前 状态 。 这 两 个 函数 都 可 以 用 
state 来 定义 : 


put s = state (\. -> ((),s)) 
get = state (\s -> (s,s)) 


男 一 方面 ，state 也 可 以 用 put 和 get 定义 : 


state f = do {s <- get; let (a,s') = f s; 
put s'; return a} 


Haskell 允许 在 do 表达 式 中 简写 let 表达 式 〈 在 列表 概括 中 也 可 简写 ) 。 简 写 规则 是 


do {let decls; stmts} = let decls in do {stmts} 


图 数 runState 是 函数 state 的 逆 : 它 取 得 一 个 动作 和 一 个 初始 状态 ， 然 后 返回 动 
作 完 成 后 的 最 终 值 和 最 终 状 态 (这 是 IO 单子 难以 完成 的 ) 。 函 数 evalState 定义 为 


evalState m s = fst (runState m s) 


而 且 只 返回 某 个 状态 下 计算 出 来 的 值 。 
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下 面 是 State 的 一 个 应 用 例子 。 在 7.6 节 定 义 了 由 一 个 非 空 列表 构造 一 个 二 叉 树 的 
下 列 程序 : 

build :: [a] -> BinTree a 

build xs = fst (build2 (length xs) xs) 


build2 1 xs = (Leaf (head xs) ,tail xs) 
build2 n xs = (Fork u v, xs'') 


Where (u,xs') = build2 m xs 
(V,XS'') = build2 (n-m) xs'! 
m =n ‘div 2 


要 注意 的 是 ，bui1g2 基本 上 是 一 个 处 理 类 型 [a] 的 状态 的 图 数 ， 并 返回 BinTree a 的 
元 素 作 为 结果 。 另 一 种 定义 buila 的 方法 如 下 : 
build xs = evalState (build2 (length xs)) xs 
build2 :: Int -> State [a] (BinTree a) 
build2 1 = do {x:xs <- get; 
put xs; 
return (Leaf x)} 
build2 n = do {u <- build2 m; 
V <- build2 (n-m); 
return (Fork u v)} 
Where m= n div” 2 


显 式 处 理 状态 的 所 有 工作 是 在 建立 叶 结 点 时 完成 的 。 先 读 取 状 态 ， 将 第 一 个 元 素 用 Leaf 
标识 ， 剩 余 的 列表 便 作 为 新 的 状态 。 如 果 说 build2 n 的 第 一 个 版 本 将 状态 显 式 地 串联 起 
来 ,那么 第 二 个 版 本 将 这 些 线程 隐藏 到 了 单子 的 面具 下 面 。 

注意 builda2 的 第 一 行 是 一 个 命令 x:xs <- get， 其 中 左边 使 用 了 一 个 模式 而 不 是 
一 个 简单 变量 。 如 果 当 前 状态 碰巧 是 空 列表 ， 那 么 这 个 动作 失败 ， 并 给 出 一 个 适当 的 错误 
信息 。 例 如 : 

ghci> runState (do {x:xs <- get; return x}) "" 


*** Exception: Pattern match failure in do expression ... 


当然 ， 这 种 情况 对 于 buila2 1 不 会 出 现 ， 因 为 该 定义 只 适用 于 状态 为 单元 素 列 表 的 
情况 。 把 puilq [] 会 出 现 什 么 情况 留 作 练习 。 
另 一 个 例子 是 生成 某 个 区 间 的 伪 随 机 数 问题 。 设 想 有 如 下 函数: 


random :: (Int,Int) -> Seed -> (Int ,Seed) 


该 图 数 输入 一 对 整数 作为 指定 的 区 间 ， 再 输入 一 个 种 子 ， 然 后 计算 一 个 随机 数 和 一 个 新 
的 种 子 。 新 的 种 子 用 于 获取 后 面 的 随机 数 。 与 其 显 式 地 说 明 什 么 是 种 子 , 假定 下 列 
明 数 : 

mkSeed :: Int -> Seed 
该 函数 用 给 定 的 整数 制作 一 个 种 子 。 现 在 如 末 想 抛 一 对 化 子 ， 可 以 定义 函数 : 


diceRoll :: Int -> (Int ,Int) 
diceRoll n = (x,y) 
Where (x,s1) = random (1,6) (mkSeed n) 
(y,S2) = random (1,6) sl1 


但 是 ， 也 可 以 定义 函数 : 
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diceRoll n = evalState (人 
do {x <- randomS (1 ,6) ; 
y <- TandomS (1,6) ; 
return (x,y)} 


) (mkSeed n) 
Where randomS = state . random 
了 疯 数 randomSs :: (Int,Int) -> State Seed Int 读 取 一 个 整数 区 间 ， 返回 一 个 动 


作 。daiceRoll 的 第 二 个 定义 比 第 一 个 稍 长 一 点 ,但 是 也 更 容易 书写 。 设 想 不 是 抛 两 个 懂 
子 ， 而 是 5 个 骨 子 ， 如 大 话 角 (liar dice)。 此 时 第 一 个 定义 方法 需要 一 系列 where 子 名 
表达 5 个 值 和 5 个 种 子 间 的 串联 ， 很 容易 写 错 ， 但 是 ， 第 二 个 定义 方法 却 很 容易 扩展 ， 又 
很 难 写 错 。 

最 后 一 点 ， 考 虑 : 


evalState (do {undefined: return 0}) 1 


这 个 会 引发 异常 ， 还 是 返回 0? 换言之 ， 单子 State 像 单 子 IO 是 严格 的 ， 还 是 惰性 的 ? 答 
案 是 两 种 都 可 能 。 状 态 单子 有 两 种 版 本 ， 一 种 是 惰性 的 ， 另 一 种 是 严格 的 ， 区 别 在 于 如 何 实 
现 运 算 ( >>= )。Haskell 提供 惰性 的 缺 省 实现 ， 在 Control .Monad.State.Lazy 中 定 
义 ， 但 是 用 户 也 可 以 选择 Control .Monad .State.Strict 中 的 严格 定义 。 


10.4 ST 单子 


状态 线程 单子 在 库 Control .Monad.sT 中 定义 ， 它 与 状态 单子 完全 不 同 ， 尽 管 两 者 
看 上 去 貌似 一 样 。 像 state s a 一 样 ， 可 以 把 状态 线程 单子 看 作 如 下 类 型 : 


type STsa=s -> (a,s) 


但 其 中 一 个 非常 重要 的 区 别 是 ， 类 型 变量 s 不 能 初始 化 为 特定 的 状态 ， 如 seed 或 者 
[Int] ， 它 在 这 里 的 作用 只 是 命名 状态 。 把 s 想象 成 一 个 标签 ， 用 于 表示 一 个 特定 的 状态 
线程 ， 所 有 的 可 变 类 型 都 用 这 个 线程 标记 ， 因 此 动作 只 能 在 它们 自己 的 状态 线程 中 影响 可 
变 值 。 

一 种 可 变 值 是 程序 变量 ( program varable ) 。 命 令 式 程序 语言 中 的 程序 变量 不 同 于 
Haskell 中 的 变量 ， 或 者 数学 中 的 变量 。 程 序 变量 可 以 看 作 其 他 值 的 引用 ， 在 Haskell 中 是 
类 型 STRef s a 的 对 象 。 这 里 的 s 表示 引用 局 部 于 状态 线程 s (没有 其 他 ) ， 这 里 的 a 是 
被 引用 值 的 类 型 。 在 Data .STRef 中 定义 了 创建 引用 、 读 写 引 用 的 运算 : 


newSTRef ‘: a=-> ST s (STRef 8 a) 
readSTRef ::; STRef s a -> STs&a 
writeSTRef :: STRef s a ->a -> STs 0 


下 面 是 一 个 例子 。 回 顾 7.6 三， 给 出 翡 波 那 契 函数 的 下 列 害 义 : 


fib :: Int -> Integer 

fibn = fst (fib2 n) 

fib2 0 = (0,1) 

fib2 n = (b,a+b) where (a,b) = fib2 (n-1) 


对 fib 求 值 运行 时 间 是 线性 的 , 但 是 所 使 用 的 空间 不 是 常数 ( 即使 忽略 任意 大 的 整数 不 
能 在 常数 空间 存储 的 事实 ) : 每 个 递归 调用 都 涉及 新 变量 a 和 了 b。 对 比 之 下 ， 下 面 是 命令 
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式 语 言 Python 中 fib 的 定义 : 


def fib (n): 
a,b = 0,1 
for i in range (0,n): 
ab = b,at+b 
return a 


定义 处 理 两 个 程序 变量 a 和 bb， 运行 空 | 
Python 代 码 翻 译 成 Haskell 代码 : 


fibST :: Int -> ST s Integer 
fibST n = do {a <- newSTRef 0; 
b <- newSTRef 1; 
repeatFor n 
(do {x <- readSTRef a; 
y <- readSTRef b; 
writeSTRef a y; 
writeSTRef b $! (xty)}); 
readSTRef a} 


注意 严格 函数 应 用 运算 符 ($ ) 的 使 用 强制 对 和 求 值 。 动 作 repeatFor 重复 一 个 动作 给 
定 的 次 数 : 


repeatFor :: Monad m => Int ->ma->m () 
repeatFor n = foldr (>>) done . replicate n 


一 切 工作 正常 ,但 是 最 后 得 到 的 是 一 个 动作 ST s Integer， 而 我 们 想 要 的 是 一 个 整 
数 。 如 何 脱离 单子 回 到 Haskell 值 的 世界 ?答案 是 提供 一 个 类 似 于 状态 单子 的 funState 
的 函数 ， 下 面 是 它 的 类 型 : 


runST :;: (forall s. ST 8 a) -> a 


这 个 类 型 不 同 于 以 前 看 到 的 其 他 Haskell 类 型 ， 它 被 称 为 二 阶 多 态 类 型 (rank 2 polymorphic 
type) ， 过 去 所 有 的 多 态 类 型 是 一 阶 的 。 这 里 表达 的 是 ，runsT 的 参数 对 s 必须 是 一 致 的 ， 
所 以 它 不 能 依赖 于 s 名 称 之 外 的 任何 信息 。 特 别 是 ， 动 作 中 每 个 STRef 的 声明 必须 市 上 
同一 个 线程 名 s。 

为 了 进一步 说 明 二 阶 类 型 ， 考虑 下 列 两 种 列表 之 间 的 区 别 : 


1Listl :: forall a. [a -> 3] 
list2 :: [forall a. a -> al 


类 型 1istl 只 是 我 们 熟悉 的 类 型 [a -> a] ， 因 为 对 一 阶 类 型 假定 了 在 最 外 围 有 全 称 量词 对 
类 型 变量 的 约束 。 例 如 ,将 Listl 的 类 型 变量 a 初始 化 为 类 型 Float， 则 [sin, cos， 
tan] 是 1ist1 的 可 能 值 。 但是， 只 有 两 个 函数 可 以 成 为 1ist2 的 元 素 ， 即 id 和 无 定义 函 
数 undefine， 因 为 只 有 这 两 个 函数 具有 类 型 forall a. a -> a。 如 果 给 出 类 型 a 的 一 个 
元 素 x, 但 对 类 型 a 没有 任何 其 他 信息 ， 那么 返回 类 型 a 的 一 个 全 只 有 两 种 选择 ，x 或 
者 上 。 

为 什么 runsT 需要 二 阶 类 型 呢 ? 叫 ， 这 样 可 以 避免 定义 下 面 的 式 子 : 


let Vv = runST (newSTRef True) 
in runST (readSTRef v) 


这 样 的 代码 不 是 类 型 正确 的 ， 因 为 


ey 


| 是 常数 (至 少 对 于 小 整数 )。 几 乎 可 以 直接 把 
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newSTRef True :: ST s (STref s Bool) 


而 且 在 表达 式 runST (newSTRef True) 中，Haskell 类 型 检测 器 不 能 将 STRef s a 与 
runsT 期 望 的 结果 类 型 a 匹配 。 类 型 STReft s a 的 值 不 能 从 ST a 输出 ， 只 有 不 依赖 于 s 
的 类 型 的 对 象 可 以 输出 。 如 果 运 行 这 样 的 代码 ， 那 么 在 第 一 个 runsT 中 分 配 的 引用 在 第 
二 个 runsT 内 也 可 以 使 用 。 这 样 就 使 得 一 个 线程 的 读 也 可 用 于 男 一 个 线程 ， 因 此 结果 依 
赖 于 执行 这 些 线程 的 次 序 ， 从 而 导致 混乱 和 困惑 。 这 也 正 是 在 IO 单子 中 极力 避免 发 生 的 
问题 。 

但 是 ， 可 以 安全 地 和 定义: 

fib :: Int -> Integer 

fib n = runST (fibST n) 
这 个 fib 定义 的 运行 时 间 是 线性 的 。 

对 用 户 来 说 ，sT 单子 的 主要 应 用 在 于 它 处 理 可 变数 组 的 能 力 。 数 组 的 整个 问题 值得 
用 一 节 讨 论 。 


10.5 可 变数 组 


因数 式 程序 设计 中 重点 的 基本 数据 结构 是 列表 ， 而 不 是 数组 ， 这 点 有 时 让 第 一 次 遇 到 
图 数 式 程序 设计 的 命令 式 程 序 员 感 到 吃惊 。 原 因 是 数组 的 大 多 数 使 用 〈 尽 管 不 是 全 部 ) 效 
率 依赖 于 它们 的 修改 是 破坏 性 的 。 一 旦 修改 了 数组 在 某 个 下 标 处 的 值 ， 那 么 旧 数 组 便 丢 失 
了 。 但 是 ， 在 函数 式 程 序 设 计 中 ， 数 据 结 构 是 持久 的 (persistent)， 而 且 任 何 命名 的 结构 
会 持续 存在 。 例 如 ，insert xt 可 能 在 树 t 中 插入 一 个 元 素 x， 但 是 t 仍然 表示 原 树 ， 
所 以 最 好 不 要 禾 诉 。 

在 Haskell 中 一 个 可 变数 组 是 类 型 STArrav s i e 的 对 象 。 这 里 s 表示 状态 线程 ，i 
表示 索引 类 型 ，e 是 元 素 类 型 。 并 非 任 何 类 型 都 可 以 做 索引 类 型 ， 合 法 的 索引 是 类 族 Ix 
的 成 员 。 这 个 类 族 的 成 员 包括 Int 和 char ， 能 够 映射 到 整数 的 某 个 连续 区 域 的 对 象 。 

像 STRefs 一 样 ， 存在 创建 、 读 和 写 数 组 的 运算 。 下 面 将 用 一 个 简洁 的 例子 说 明 这 些 
运算 。 回 顾 7.7 市 的 快速 排序 : 


qsort :: (0rd a) => [a] -> [al 

qsort [] = [] 

qsort (x:xs) = qsort [y | y <- xs, y < x] ++ [x] ++ 
qsort [y | y <- xs, x <= y] 


当时 就 说 ， 快 速 排序 是 用 数组 实现 的 ， 而 不 是 用 列表 ; 划分 可 以 原 地 (in place) 完 
成 ， 而 不 需要 和 额外 空间 。 现 在 具备 了 实现 这 种 算法 的 工具 。 首 先 给 出 如 下 定义 : 


qsort :: (0rd a) => [a] -> [al] 
qsort xs = runST $ 
do {xa <- newListArray (0,n-1) xs; 
qsortSsT xa (0,n); 
getElems xa} 
where n = length xs 


首先 创建 一 个 具有 边界 (0 ,nm -1 ) 的 可 变数 组 ， 并 用 xs 的 元 素 填 充 ; 然后 数组 上 的 
排序 由 动作 qsortsT xs (0 ,n) 完 成 ; 最 后 返回 有 序数 组 元 素 构成 的 列表 。 上 面 代码 中 ， 
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动作 newListArray 具有 类 型 ; 


Ix i => (i, i) -> [e] -> ST 8 (STArray s i e) 


而 且 getElems 具有 类 型 : 


Ix i => STArray s i e -> ST s [ej] 


第 一 个 动作 用 一 个 列表 构造 一 个 可 变数 组 ， 第 二 个 返回 一 个 可 变数 组 中 元 素 的 列表 。 

qsortST xa (a,b) 的 目标 是 将 xa 在 区 间 (a,b) 上 的 子 数组 排序 ， 根 据 定义 这 个 区 
间 包 含 下 界 ， 但 不 包含 上 界 ， 换 句 话 说 是 区 间 [a .. b -1]。 选 择 左 闭 右 开 区 间 几 乎 总 是 
处 理 数组 的 最 好 选择 。 下 面 是 qsortSsT 的 定义 : 


qsortSsT :: Drd a => STArray s Int a -> 
(Int ,Int) -> ST s () 
qsortST xa (a,b) 
| a==b = return () 
| otherwise = do {m <- partition xa (a,b); 
qsortST xa (a,m); 
qsortST xa (m+1,b)} 


如 采 a ==b， 则 区 间 为 空 ， 无 需 做 任何 工作 ; 和 否则， 将 数组 元 素 重 写 排列 ， 使 得 对 于 某 个 
适当 的 x， 在 区 间 (a,m) 的 所 有 元 素 都 小 于 x， 在 区 间 (m +1,b) 上 的 所 有 元 素 都 大 于 或 
者 等 于 Xx， 元 素 x 本 号 存放 在 位 置 m 处 ， 然 后 对 两 个 子 区 间 排 序 ， 从 而 结束 排序 。 

接 下 来 的 工作 是 定义 partition。 寻 找 合 适 定义 的 唯一 方法 是 利用 前 置 条 件 、 后 置 
条 件 和 循环 不 变量 进行 形式 化 的 开发 。 但 是 ， 本 书 是 关于 函数 式 程序 设计 的 ， 不 是 命令 式 
程序 的 形式 化 开发 ， 所 以 这 里 仅仅 给 出 一 种 定义 : 


partition xa (a,b) 
= do {x <- readArray xa a; 
let loop (j,k) 
= if j==k 
then do {swap xa a (k-1); 
return (k-1)} 
else do {y <- readArray xa j; 
if y < x then loop (j+1,k) 
else do {swap xa j (k-1); 
loop (j,k-1)}} 
in loop (at+i,b)} 


动作 swap 的 定义 如 下 : 


swap :: STArray s Int a -> Int -> Int -> STs () 
Swap xa i j = do {v <- readArray xa i; 
Ww <- readArray xa j; 
writeArray xa i Wi; 
writeArray xa j v} 


下 面 解释 partition 是 如 何 进 行 划 分 的 ， 这 种 解释 简洁 但 一 定 不 够 充分 。 用 第 一 
元 素 作 为 枢纽 ， 然 后 进入 循环 处 理 剩余 的 区 间 (a +1,b)， 直 至 区 间 为 空 时 停止 。 机 
于 x 的 元 素 ， 区 间 左 边界 右 移 。 当 遇 到 大 于 x 的 元 素 y 时 ， 将 其 与 区 间 最 右 元 素 交 换 ， 
右边 界 左 移 。 当 区 间 为 空 时 ， 将 枢纽 放 在 它 的 最 终 位 置 上 ， 并 将 这 个 位 置 作为 结果 返回 。 
注意 1oop 是 单子 中 的 一 个 局 部 过 程 ， 也 可 以 将 其 定义 为 一 个 全 局 过 程 ， 这 样 便 需 要 
增加 3 个 参数 ， 即 数组 xa、 枢 纽 x 和 开始 位 置 a。 
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哈 希 表 


纯 函数 式 快 速 排 序 与 基于 可 变数 组 的 快速 排序 具有 相同 的 渐进 时 间 性 能 ， 但 是 在 个 别 
场合 可 变数 组 似乎 对 于 获得 渐进 更 快 的 算法 起 到 关键 的 作用 。 一 种 情况 是 哈 硕 表 中 集合 的 
有 效 表示 。 

下 面 用 一 个 特殊 问题 说 明 哈 希 表 的 应 用 。 考 虑 用 两 个 有 限 集 定义 的 典型 谜 题 ， 一 个 位 
置 (position) 集合 和 一 个 移动 (move) 集合 。 以 下 是 给 定 的 函数 : 


moves :: Position -> [Move] 
move :: Position -> Move -> Position 
solved :: Position -> Bool 


函数 moves 描述 在 一 个 给 定位 置 可 以 进行 移动 的 集合 ，solved 确定 构成 谜 题解 的 
位 置 。 解 谜 题 就 是 找到 一 个 从 给 定 开始 位 置 到 解 位 置 的 移动 序列 ， 最 好 是 最 短 序列 : 


solve :: Position -> Maybe [Move] 


如 果 不 存 在 从 位 置 p 到 一 个 解 位 置 的 移动 序列 ， 那 么 什 solve p 是 Nothing， 否 则 
是 Just ms， 满足 : 


solved (foldl move p ms) 


下 面 将 通过 宽度 优先 (breadth first) 搜索 实现 solve。 宽 度 优先 搜索 指 先 检查 从 开始 
位 置 一 次 移动 能 够 到 达 的 所 有 位 置 ， 然 后 检查 两 次 移动 能 到 达 的 所 有 位 置 ， 等 等 。 因 此 ， 
如 果 存 在 解 ， 那 么 宽度 优先 搜索 将 找到 最 短 解 。 为 实现 宽度 优先 搜索 ， 需 要 下 列 类 型 : 


type Path = ([Move] ,Position) 
type Frontier = [Path] 


一 条 路 径 由 一 个 从 开始 位 置 的 移动 序列 (按照 逆序 表示 ) 和 这 些 移动 到 达 的 最 后 位 置 构 
成 。 前 沿 (frontier) 是 一 个 有 待 扩 展 成 更 长 路 径 的 列表 。 宽 度 优先 搜索 于 是 可 以 如 下 定义 : 

solve p = bfs [] [([] ,p)] 

bfs :: [Position] -> Frontier -> Maybe [Move] 


bfs ps [] = Nothing 
bfs ps ((ms,p) :mps) 


| solved p = Just (reverse ms) 
| p “elem ps = bfs ps mps 
| otherwise = bfs (p:ps) (mps ++ succs (ms,p)) 


succs :: Path -> [Path] 
succs (ms,p) = [(m:ms,move p m) | m <- moves p] 


函数 bfs 的 第 一 个 参数 ps 表示 已 经 访问 位 置 的 集合 。 第 二 个 参数 是 前 沿 ， 并 使 用 队 
列 处 理 ， 以 保证 相同 长 度 的 路 径 处 理 后 再 处 理 它们 的 扩展 。 检 查 一 个 路 径 时 ; 如 果 其 最 后 
位 置 是 解 位 置 ， 则 接受 该 路 径 ; 如 果 其 最 后 位 置 已 经 访问 过 ， 则 拒绝 该 路 径 ， 否 则 在 前 沿 
后 面 添加 后 继 移 动 扩展 路 径 。 成 功 路 径 的 移动 序列 在 作为 结果 返回 前 先 置 逆 ， 这 是 为 了 
succs 在 添加 后 继 时 可 以 将 后 继 加 在 列表 的 前 面 ， 而 不 是 加 在 列表 尾部 ， 以 提高 效率 。 

羡 数 bfs 中 影响 效率 的 主要 来 源 有 两 个 ， 一 个 是 ( ++) 的 使 用 ,为 一 个 有 关 elem。 
首先 ， 前 沿 的 规模 可 能 呈 指 数 式 增长 ， 所 以 在 前 沿 的 尾部 添加 后 继 很 慢 。 最 好 的 方法 是 如 
下 定义 bfs: 
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bfs :: [Position] -> Frontier -> Frontier -> 
Maybe [Move] 

bfs ps [] [] = Nothing 

bfs ps [] mqs = bfs ps mqs 门 

bfs ps ((ms,p):mps) mqs 


| solved p = Just (reverse ms) 
| p “elem ps = bfs ps mps mgs 
| otherwise = bfs (p:ps) mps (succs (ms,p) ++ mqs) 


附加 的 参数 是 临时 前 沿 ， 用 于 存储 后 继 。 当 第 一 个 前 沿 已 耗 尽 为 空 时 ， 临 时 前 沿 成 为 新 的 
前 沿 。 在 临时 前 沿 前 面 添加 后 继 需 要 的 时 间 正 比 于 后 继 的 个 数 ， 而 不 是 前 沿 的 规模 ， 所 以 
算法 运行 更 快 。 男 一 方面 ， 新 的 bfs 不 同 于 旧 的 定义 ， 因 为 后 续 的 前 沿 交替 地 从 左 到 右 
与 从 右 到 左 人 遍历。 不过， 只 要 存在 解 ， 那么 最 短 解 仍 将 被 找到 。 

第 二 个 低 效 来 源 是 成 员 测 试 。 用 列表 存储 已 经 访问 过 的 位 置 效 率 低 ， 因 为 成 员 测 试 花 
费 的 时 间 可 能 正比 于 当前 访问 过 的 位 置 数 。 如 有 果 位 置 用 区 间 [0 . .n -1] 的 整数 表示 ， 那 
么 问题 会 好 得 多 ， 因 为 此 时 可 以 用 边界 为 (0,n -1 ) 的 布尔 数组 标记 访问 过 的 位 置 ， 成 员 
测试 只 需要 在 单个 数组 上 进行 查找 。 

可 以 设想 将 位 置 用 整数 编码 ， 但 并 不 是 用 上 自然数 的 茶 个 初始 段 。 例 如 ， 数 独 位置 〈 见 
第 5 章 ) 可 以 表示 成 81 位 整数 。 所 以 ,假设 有 将 位 置 用 整数 编码 的 函数 : 


encode :: Position -> Integer 


为 了 缩小 表示 区 间 ， 对 于 某 个 适当 的 n :: Int， 和 定义 : 


hash :: Position -> Int 
hash p = fromInteger (encode p) ‘mod* 1n 


函数 hash 的 结果 是 区 间 [0 . .n -1] 中 的 一 个 整数 。 

一 个 问题 ， 也 是 最 大 的 问题 : 不 同 的 位 置 可 能 哈 布 到 同一 个 整数 。 解 决 这 个 问题 时 ， 
我 们 不 使 用 布尔 数组 ， 而 使 用 位 置 列 表 数 组 。 数 组 下 标 左 处 存储 哈 布 但 为 大 的 列表 。 虽 然 
并 不 能 保证 在 最 坏 情 况 下 能 够 改进 算法 效率 ,但 是 ， 如 果 n 取 适当 大 的 整数 ， 而 且 喻 希 函 
数 相对 均匀 地 将 整数 赋 给 位 置 ， 那 么 成 员 测 试 的 复杂 度 可 以 减 小 为 原来 的 1/n。 

使 用 哈 硕 方 法 ， 修 改 后 的 solve 定义 如 下 : 


solve :: Maybe [Move] 
solve = TunST $ 
do {pa <- newArray (0,n-1) []; 
bfs pa [([],start)] []} 


bfs :: STArray s Int [Position] -> Frontier -> 
Frontier -> ST s (Maybe [Move]) 
bfs pa [] [] = return Nothing 
bfs pa [] mqs = bfs pa mqs [] 
bfs pa ((ms,p) :mps) mqs 
= if solved p then return (Just (reverse ms)) 
else do {ps <- readArray pa k; 
if p “elem ps 
then bfs pa mps mqs 
else 
do {writeArray pa k (p:ps); 
bfs pa mps (succs (ms,p) ++ mqs)}} 
where k = hash p 
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10.6 不 变数 组 


讲 到 数组 ， 必 须 指出 Haskell 提供 了 一 个 很 好 的 库 Data .Array， 该 库 提 供 了 不 变数 
组 上 的 纯 函数 式 运算 。 运 算 用 可 变数 组 实现 ,但 接口 是 纯 函 数 式 的 。 

类 型 Array i e 是 数组 的 抽象 类 型 ， 其 中 i 是 下 标 类 型 ，e 是 元 素 类 型 。 构 造 数 组 
的 基本 运算 是 

array :7 Ix 1 mD (id => [(iye)] => Array i 6 
函数 的 第 一 个 输入 是 一 对 边界 ， 即 数组 的 最 小 下 标 和 最 大 下 标 ; 第 二 个 参数 是 下 标 和 元 又 
对 的 联合 列表 ,说明 数组 在 各 个 下 标 处 的 元 素 ; 结果 是 给 定 边界 和 元 素 的 数组 。 在 联合 列 
表 中 没有 说 明 元 素 值 的 数组 元 素 将 是 无 定义 值 。 如 果 两 个 元 素 有 相同 的 下 标 ， 或 者 其 中 一 
个 下 标 越 界 ， 则 结果 是 无 定义 的 数组 。 因 为 有 了 这 些 测 试 ， 数 组 的 构造 对 于 下 标 是 严格 
的 ， 但 是 对 于 元 素 则 是 惰性 的 。 构 造 数组 的 时 间 复 杂 度 与 元 素 个 数 呈 线性 关系 。 

一 个 简单 的 array 特例 是 1istArzay ， 其 输入 中 只 需 说 明 元 素 列表 : 

listArray :: Ix i => (i,i) -> [e] -> Array i e 

listArray (1,r) xs = array (1,r) (zip [1..r] xs) 

男 外 一 种 构造 数组 的 方法 称 为 accumArray, 其 类 型 看 上 去 有 些 吓 人 : 


Ix i => (@ -> Vv -> e) ->e-> (i,i) -> [(i,v)] -> Array i e 


第 一 个 参数 是 “累积 函数 ”， 用 于 将 数组 元 素 和 新 值 转换 为 新 的 数组 元 素 ; 第 二 个 参数 是 
每 个 数组 元 素 的 初始 值 ; 第 三 个 参数 是 一 对 上 下 界 ; 第 四 个 也 就 是 最 后 一 个 参数 是 下 标 和 
值 的 联合 列表 ; 结果 是 一 个 数组 。 构 造 方法 是 将 累积 函数 应 用 于 初始 值 与 联合 列表 的 每 个 
元 素 ， 得 到 数组 相应 位 置 的 新 元 素 。 如 果 假 定 累积 函数 是 常数 时 间 的 ， 那么 构造 过 程 的 运 
行 时 间 线 性 于 联合 列表 的 长 度 。 

以 上 是 用 语言 描述 的 accumArray 的 功能 ， 用 符号 表示 如 下 : 

elems (accumArray f e (1,r) ivs) 

= [foldl f @ [v | (i,v) <- ivs, i==j] | j <- [1..r]] 

其 中 elems 按照 数组 下 标 顺 序 返回 数组 的 元 素 列 表 。 不 过 ， 以 上 等 式 不 完全 正确 : 对 于 
ivs 需要 添加 约束 条 件 ， 即 每 个 下 标 应 该 介 于 指定 的 区 间 。 如 果 这 个 条 件 不 满足 ， 那 么 左 
边 返 回 销 误 ， 而 右边 则 不 然 。 

呆 数 accumArray 看 似 复杂 ,但 它 是 解决 某 类 问题 的 一 个 非常 有 用 的 工具 。 这 里 
给 出 两 个 例子 。 第 一 ， 考 虑 有 向 图 的 表示 。 有 问 图 往往 在 数学 上 描述 为 一 个 结 点 (ver- 
tex) 集 和 一 个 边 (edge) 集 。 一 条 边 是 一 个 结 点 有 序 对 (j,k) ， 表 示 该 边 由 结 点 j 指 
向 结 点 不， 称 结 点 大 邻接 于 结 点 j 以 下 假设 用 1 到 的 整数 表示 结 点 ,，n 是 某 个 整数 。 
因此 ， 有 


type Vertex = Int 


type Edge = (Vertex,Vertex) 
type Graph = ([Vertex], [Edge]) 


vertices g = fst 区 
edges 区 = Snd g 
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在 程序 设计 中 ， 有 向 图 经 常用 邻接 表 表 示 : 


adjs :: Graph -> Vertex -> [Vertex] 
adjs gv= [k | (j,k) <- edges g, j==Vv] 


这 种 adjs 定义 的 问题 在 于 计算 任何 特定 结 点 的 邻接 表 需 要 的 时 间 与 边 数 成 正比 。 更 好 的 
方法 是 用 数组 实现 adjs: 


adjArray :: Graph -> Array Vertex [Vertex] 


因此 有 


adjs g v = (adjArray g)!v 


其 中 ( ! ) 表示 数组 下 标 索 引 运 算 。 对 于 相对 合理 规模 的 数组 ， 该 运算 是 常数 时 
间 的 。 
下 面 是 adjArray 的 说 明 : 


elems (adjArray Eg) 
= [[k | (j,k) <- edges g, j==v] | Vv <- vertices g] 


利用 这 个 说 明 可 以 直接 计算 adjArray 的 定义 。 为 了 缩短 代码 行 ， 将 edges g 简 记 为 
es，vertices g 人 简 记 为 vs， 则 有 
elems (adjArray g) = [[k | (j,k) <- es, j==v] | v <- vs] 


关注 等 式 右边 ， 第 一 步 用 定律 foldr (:) [] = id 重 写 。 由 此 给 出 下 列表 达 式 : 


[foldr (:) [] [k | (j,k) <- es, j==v] | v <- vs] 
下 一 步 利 用 定律 foldr f e xs = foldl (flip f) e (reverse xs)， 其 中 xs 是 
任意 有 穷 列表 。 简 写 flip (:) 为 (8@)， 得 到 


[foldl (@) [] (reverse [k | (j,k) <- es, j==v]) | v <- vs] 


将 reverse 分 配 后 得 到 表达 式 : 


[foldl (@) [] [k | (j,k) <- reverse es, j==v] | Vv <- vs8s] 


下 一 步 利 用 swap (j,k) = (k,j) 得 到 


[foldl (@) [] [j | (k,j) <- es', j==v] | v <- vs] 


其 中 es' = map swap (reverse es)。 最 后 , 利用 n = lengh vs 和 accumArray 的 
说 明 得 到 


elems (adjArray g) 
= elems (accumArray (flip (:)) [] (1,n) es') 


这 表明 可 以 定义 : 


adjArray g = accumArray (flip (:)) [] (i,n) es 
where n = length (vertices g) 
es = map swap (reverse (edges g)) 


这 个 adjArray g 的 定义 可 以 用 正比 于 边 数 的 时 间 计 算 后 继 。 
下 面 是 accumArray 的 第 二 个 应 用 例子 。 假 设 给 定 n 个 整数 的 列表 ， 所 有 整数 在 区 
间 (0，m) 中 ，m 是 茶 个 整数 。 可 以 通过 计算 每 个 元 素 出 现 的 次 数 ， 用 @(m +n) 步 对 
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这 个 列表 排序 : 


count :: [Int] -> Array Int Int 
count xs = accumArray (+) 0 (0,m) (zip xs (repeat 1)) 


其 中 repeat 1 是 无 穷 个 1 的 列表 。 计 数 需 要 @(n) 步 。 计 数 完 成 后 ， 可 以 如 下 排序 : 


sort xs = concat [replicate c x 
| (x,c) <- assocs (count xa)] 


函数 assocs 也 是 一 个 库 函 数 ， 它 返回 一 个 数组 中 所 有 下 标 和 元 素 对 构成 的 列表 ， 并 按照 
下 标 顺 序 排列 ， 排 序 可 以 在 8(m) 步 完成 。 
除 以 上 几 个 运算 外 ， 库 Data .Array 还 包含 一 两 个 其 他 运算 ， 包 括 更 新 运算 ( //): 


(//) :: Ix i => Array i e -> [(i,e)] -> Array i e 


例如 ， 如 果 xa 是 nxn 和 窍 了 泗 ， 那 么 
xa /i [CI 2) 0 | <= 人 -ad 


表示 同一 个 和 矩阵， 只 是 对 角 线 元 素 都 变 成 了 0。 运 算 (//) 的 缺点 是 它 的 运行 时 间 与 数组 
的 长 度 成 正比 ， 即 便 只 更 新 一 个 元 素 也 如 此 。 原 因 是 旧 的 数组 xa 依旧 存在 ， 所 以 必须 构 
建 一 个 全 新 的 数组 。 

在 本 章 结 尾 又 回 到 了 纯 函 数 式 程序 设计 世界 ， 在 这 个 世界 中 等 式 推 理 既 可 以 用 来 计算 
定义 ， 也 可 以 优化 定义 。 尽 管 单子 式 程序 对 于 习惯 于 命令 式 程序 设计 的 程序 员 很 有 吸引 
力 ， 但 是 对 于 如 何 对 单子 式 程序 进行 推理 是 一 个 问题 。 当 然 ， 等 式 推理 可 应 用 于 一 定 的 场 
合 〈 见 习题 下 的 例子 ) ， 但 是 等 式 推理 不 能 像 在 纯 函 数 式 程序 设计 中 那么 广泛 应 用 〈 快 速 
排序 的 正确 性 见证 了 这 点 )。 命 令 式 程序 员 也 有 同样 的 问题 ， 他 们 的 解决 方法 (如 果 他 们 
愿意 这 样 做 的 话 ) 是 利用 谓词 演算 、 前 置 条 件 、 后 置 条 件 和 循环 不 变量 。 如 何 对 单子 式 代 
码 进行 推理 仍然 是 当前 的 研究 课题 。 

笔者 的 建议 是 ， 保 守 使 用 单子 式 程序 ， 而 且 只 有 确实 有 用 时 使 用 ; 和 否则， 函数 式 程序 
设计 最 重要 的 特色 ， 即 对 代码 进行 数学 推理 的 能 力 便 失 去 了 。 


10.7 习题 
习题 A 回顾 定义 : 
putStr = foldr (>>) done . map putChar 


请 问 下 列 代码 的 功能 是 什么 ? 


foldl (>>) done . map putChar 


请 将 ( >> ) 用 ( >>=) 代替 ， 然 后 用 单子 律 证 明 得 到 的 结论 。 
习题 B 使 用 模式 匹配 的 方法 定义 下 面 的 函数 : 


add3 :: Maybe Int -> Maybe Int -> Maybe Int -> Maybe Int 


该 图 数 将 3 个 数 相 加 ， 如 果 存 在 的 话 
现在 用 单子 Maybe 重 写 定义 add3。 
习题 C”10. 1 节 中 cp 的 定义 仍然 是 低 效 的 。 更 好 的 方法 可 能 是 定义 : 
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cp (xs:xss) = do {ys <- cp xss; 
X <- XS; 
return (x:ys)} 


根据 定义 ， 一 个 单子 是 可 交换 的 ， 如 果 下 面 等 式 成 立 ; 
de {x <= py y < qi 
0 {y < qf pi 对 
IO 单子 显然 不 是 可 交换 的 ， 然 而 有 的 单子 是 可 交换 的 。 请 问 单子 Maybe 是 可 交换 
的 吗 ? 
习题 D ”每 个 单子 是 一 个 函 子 。 请 完成 下 列 定义 : 
instance Monad m => Functor m where 
fmap :: (a -> b) ->ma->mb 
fmap £f = ... 
目前 Haskell 不 要 求 类 族 Monad 必须 是 类 族 Functor 的 子 类 族 ， 但 是 在 将 来 发 行 的 
版 本 中 有 改变 这 种 情况 的 计划 。 目 前 Haskell 为 单子 提供 了 一 个 等 价 于 fmap 的 函数 
1iftM。 请 用 return 和 >>= 给 出 1iftM 的 定义 。 
函数 join :: m (m a) -> ma 将 双 层 单子 结构 扁平 化 为 单 层 。 请 用 >> = 定义 
join。 对 于 列表 单子 ，join 和 1iftM 给 出 哪些 熟悉 的 函数 ? 
最 后 ， 使 用 join 和 1iftM 定义 ( >>=)。 由 此 得 出 ,定义 单子 时 也 可 以 不 用 
return 和 >>= ， 而 使 用 return、1iftM 和 join。 
习题 E 几 个 有 用 的 单子 函数 定义 在 库 Control. Monad 中 。 例 如 : 


sequence_ :: Monad m => [ma] -> m () 
sequence_ = foldr (>>) done 


(在 Haskell 中 有 些 地 方 习 惯用 下 划 线 表示 动作 的 结果 是 单位 元 类 型 。) 定义 相关 的 函数 : 
sequence :: Monad m => [ al -> m [al 
请 利用 这 两 个 函数 定义 下 列 函 数 : 


mapM_ :: Monad m => (a -> mb) -> [a] -> m () 
mapM :: Monad m => (a -> mb) -> [a] -> m [bj] 


另外 ， 请 定义 : 

foldM :: Monad m => (b ->a->mb) ->b-> [al ->mb 

在 本 书 中 曾 用 到 函数 repeatFor n 重复 一 个 动作 n 次 。 请 将 该 函数 推广 为 下 列 
图 数 : 

for_:: Monad m => [a] -> (a -> mb) ->m() 


习题 F 下 面 是 单子 式 等 式 推理 的 练习 。 考 虑 浮 数 : 


add :: Int -> State Int () 
add n = do {m <- get; put (m+n)} 


任务 是 证 明 : 


Sequence_ . map add = add . sum 


其 中 sequence 是 习题 中 定义 的 函数 ，sum 求 一 个 整数 列表 的 累加 和 。 证 明 需 要 
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foldr 的 融合 律 、put 和 get 的 简单 定律 ， 以 及 单子 律 : 

do {stmtsi} >> do {stmts2} = do {stmtsi;stmts2} 
这 个 定律 成 立 的 条 件 是 stmtsl 和 stmts2 不 相交 。 

习题 G 证 明 峙 跳 规 则 : (£f >=> g) . h = (f£ . h) >=> g。 然后 使 用 这 条 规则 证 
明 (zeturn . h) >=> 9 =dg .ho 

习题 H 请 证 明 : 


liftM f = id >=> (return ，Tf) 
join = id >=> id 


描述 单子 律 的 第 四 种 方法 是 使 用 习题 D 的 两 个 函数 1iftM 和 join。 关 于 这 两 个 恩 


数 有 7 条 定律 ， 每 一 条 看 上 去 都 眼熟 : 
liftM id = id 


liftM (f . g) = liftM f . liftM g 


liftM f . return = return .于 
liftM f . join = join . liftM (liftM f£) 


join . return = id 
join . liftM return = id 
join . liftM join = join . join 


请 证 明 第 四 条 定律 。 
习题 | 请 问 builq [] 的 作用 是 什么 ( 见 10.3 市 )? 
习题 」 编写 一 个 玩 猜 单词 游戏 hangman 的 交互 程序 。 一 个 交互 过 程 如 下 : 


ghci> hangman 

I am thinking of a word: 
Try and guess it. 

guess: break 

i 

guess: parties 

Wrong number of letters! 
guess: party 

“appy 

guess: happy 

You got it! 

Play again? (yes or no) 
no 

Bye! 


假设 秘密 词 的 列表 存储 在 名 为 Words 的 文件 中 ， 所 以 , 动作 xs <- readFile 
"words "将 文件 作为 一 个 字符 列表 读 出 。 男 外 ，readFile 是 惰性 的 ， 即 它 根据 需要 读 
取 内 容 。 
习题 K ”请 使 用 一 次 STRef 的 一 个 fibsT 定义 fib 的 男 一 个 版 本 。 
习题 L 定义 两 个 正 整数 的 最 大 公约 数 的 一 种 方法 如 下 : 


gcd (x,y) | x==y = x 
| x<y = gcd (x,y-x) 
| x>y = gcd (x-y,y) 
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将 该 定义 翻译 成 两 个 程序 ， 一 个 使 用 单子 State， 男 一 个 使 用 单子 ST。 

习题 M 这 里 是 一 个 具体 的 谜 题 ， 可 以 用 宽度 优先 搜索 来 解决 。Sam Loyd 的 著名 
15 数字 推 盘 洲 戏 的 一 个 简单 版 本 是 8 数字 推 盘 游戏 。 给 出 一 个 3 x3 的 阵列 ， 包 含 了 标 
有 数字 1 ~8 的 方块 ， 为 有 一 个 空位 。 可 以 将 一 个 方块 推 人 临近 的 空位 。 根 据 空 位 所 在 
位 置 ， 可 以 将 标 有 数字 的 方块 上 移 、 下 移 、 左 移 或 者 右 移 。 游 戏 开 始 时 空位 在 左上 角 ， 
其 他 方块 按照 1 ~8 有 序 排列 。 游 戏 结束 时 ， 空 位 在 右 下 角 ， 其 他 方块 依然 按照 1 ~8 有 
序 排列 。 

如 果 愿 意 接受 挑战 的 话 ， 任 务 是 给 出 位 置 和 移动 的 合适 表示 ， 并 定义 函数 moves、 


move、solved 和 encode。 


10.8 答案 


习题 A 答案 断言 (>>) :: IO () -> IO () -> IO () 满 足 结合 律 ， 并 有 单位 元 
done。 这 表明 对 于 所 有 有 穷 串 xs 有 


putStr xs = foldl (>>) done (map putChar xs) 


下 面 重 点 给 出 结合 律 的 证 明 。 首 先 ， 对 于 IO () 中 的 动作 有 


P>>Qq= 了 Pz>>= const 9q 


其 中 const xy = x。 现 在 可 以 做 如 下 推理 : 


(p >2 gq) >> x 
= {(>>) 的 定义 } 

(p >>= const q) >>= const r 
= {第 三 个 单子 律 } 

P >>= const (gq >>= const r) 
= {(>>) 的 定义 } 

P >>= const (q >> r) 
=  {(>>) 的 定义 } 


p >> (q >> T) 

习题 B 答案 直接 的 定义 使 用 了 有 通配符 的 模式 匹配 : 
add3 Nothing _ . = Nothing 
add3 (Just x) Nothing . = Nothing 


add3 (Just x) (Just y) Nothing = Nothing 
add3 (Just x) (Just y) (Just z) = Just (x+y+Z) 

这 个 定义 保证 add Nothing undefined = Nothing。 
单子 式 定义 如 下 : 


add3 mx my mz 
= do {x <- mx; y <- my; Z <- mz; 
return (x + y + 2z)} 


习题 C 答案 ”是 的 。 交 换 律 如 下 : 


P >>= \x -> q >>= \y ->fxy 
= q >>= \y -> p>>= \x -> fxy 


对 于 单子 Maybe， 需 要 验证 4 种 可 能 的 情况 。 例 如 ， 如 果 p = Nothing, q = Just y， 
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那么 两 边 都 简化 为 Nothing。 其 他 情况 的 验证 类 似 。 
习题 D 答案 定义 为 
fmap f p= P >>= (return . f£) 
joinp = p >>= id 
对 于 列表 单子 有 1iftM = map 和 join = concat。 
另 一 个 方向 的 定义 为 


P >>= f = join (liftM f p) 


习题 E 答案 ”函数 sequence 的 定义 为 


sequence :: Monad m => [m a] -> m [al 
sequence = foldr k (return []) 
Where kpq= do {x <- p; xs <- q; return (x:xs)} 


两 个 新 的 映射 函数 定 为 


mapM_ f = Sequence_ . map f 
mapM f = Sequence . map 工 


函数 foldM 定义 为 


foldM :: Monad m => (b -> a -> m b) -> 
b -> [a] -> mb 
foldM f e [] = return e 
foldM f e (x:xs) = do {y <- f exi foldM f y xs} 


注意 foldM 类 似 于 f0191， 从 左 到 右 进 行 。 最 后 ,for = flip mapM_。 
习题 F 答案 ”首先 注意 到 ， 利 用 6.3 节 给 出 的 foldr 和 map 的 融合 律 得 到 


sequence. . map add 
= foldr (>>) done . map add 
= foldr ((>>) . add) done 


此 外 ， 有 


((>>) . add) n p = add n >> P 


因为 sum = foldr ( +) 0， 这 表明 我 们 必须 证 明 : 


foldr (\ np -> add n >> p) = add . foldr (+) 0 
这 个 式 子 看 上 去 像 foldr 融合 律 的 一 种 特例 。 因 此 ， 需 要 证 明 ada 是 严格 的 (是 的 )， 
而 且 有 
add 0 = done 
add (n+ n') = add n >> add 1n' 
下 面 是 证 明 : 
add 0 
= {和 XJ 
do {m <- get; put (m+0)} 
= {算术 } 
do {m <- get; put m} 
= {put 和 get 的 简单 定律 } 


done 
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由 此 结束 第 一 个 等 式 的 证 明 。 对 于 第 二 个 等 式 ， 从 较 复 杂 一 边 开 始 推理 : 


add n >> add n’ 
= {二 文 ] 
do {1 <- get; put (1 + n) } >> 
do fm <- get; put (m + n’)} 
= {单子 律 } 
do {1 <- get; put (1 + n); m <- get; put (m + n’)} 
= {put 和 get 的 简单 定律 } 
do {1 <- get; put ((1 + n) + n’)} 
= {(《+) 的 结合 律 ;add 的 定义 } 
add (n + n’) 


习题 G 答案 ”推理 如 下 : 
(f >=> g) (h x) 

= {(>=>) 的 定义 } 

f (h X) >>= 区 

= {(>=>) 的 定义 } 
(f . h >=> g) x 


对 于 第 二 部 分 : 
(return . h) >=> 多 
= { 蛙 跳 规 则 } 
(return >=> g) . h 
= {单子 律 } 
区 


习题 H 答案 ”简化 第 四 条 规则 的 两 边 。 对 于 左边 的 化 简 : 
liftM f . join 

= {定义 } 
(id >=> (return . f)) . (id >=> id) 

= 1{ 蛙 跳 规则 及 id . f = f} 


(id >=> id) >=> (return . f£) 


对 于 右边 的 化 简 : 
join . liftM (liftM 了 ) 
= 定义} 
(id >=> id) . (id >=> return . (id >=> (return . f))) 
= 1{ 蛙 跳 规则 及 (>=>) 的 结合 律 } 
id >=> (return . (id >=> (return . f))) >=> id 
= {因为 (return . hb) >=> g = g .hh} 
id >=> id >=> (return . f£) 


因为 ( >=> ) 满足 结合 律 ， 所 以 两 边 相 等 。 
习题 | 答案 Builda [] 引 起 无 穷 循环 ， 所 以 其 值 为 上 。 
习题 J 答案 ” 主 函 数 定义 如 下 : 

hangman :: I0 () 


hangman = do {xs <- readFile "Words"; 
play (words xs)} 
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函数 play 对 文件 中 的 不 同 词 玩 任 意 多 次 (假定 总 是 有 足够 的 词 ): 


Play (w:ws) 

= do {putStrLn "I am thinking of a word:"; 
putStrLn (replicate (length w) '-'); 
putStrLn "Try and guess it."; 
guess Ww ws} 


函数 guess 处 理 一 次 猜测 ， 并 将 剩余 的 词 留 作 后 续 的 游戏 : 


Euess W WS 
= do {putStr "guess: "; 
Ww' <- getLine; 
if length w' /= length W then 
do {putStrLn "Wrong number of letters!"; 
guess W ws} 
else if Ww' == W 
then 
do {putStrLn "You got it!"; 
putStrLn "Play again? (yes or no)'"; 
ans <- getLine; 
if ans == "yes" 
then play ws 
else putStrLn "Bye!"} 
else do {putStrLn (match w' Ww); 


guess Ww ws}} 
最 后 定义 match: 
match w' Ww = map check Ww 


where 
check x = if x “elem Ww' then x else '—'! 


习题 K 答案 下 面 程序 正确 ， 但 是 运行 空间 不 是 向 数 空间 : 


fibn = fst $ runST (fibST n) 


fibST :: Int -> ST s (Integer,Integer) 
fibST n = do {ab <- newSTRef (0,1); 
repeatFor n 
(do {(a,b) <- readSTRef ab; 
writeSTRef ab $! (b,at+b)}); 
readSTRef ab} 


原因 是 (b,a +b) 已 经 是 首 范式 ， 所 以 严格 应 用 不 起 作用 。 为 了 迫使 分 量 的 运算 ， 倒 数 第 
二 行 需要 修改 为 


b ‘seq (a+b) ‘seq writeSTRef ab (b,a+b) 


习题 上 答案 使 用 单子 State 的 定义 : 


gcd (x,y) = fst $ runState loop (x,y) 


loop :: State (Int,Int) Int 
loop = do {(x,y) <- get; 
if x == y 
then return x 
else if x<y 
then do {put (x,y-x); loop} 
else do {put (x-y,y); loop}} 
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使 用 单子 ST 的 定义 : 


gcd (x,y) = TunST $ 
do {a <- newSTRef x; 
b <- newSTRef y; 
loop a b} 


loop :: STRef 8 Int -> STRef 8 Int -> ST s Int 
loop ab 
= do {x <- readSTRef a; 
y <- readSsTRef b; 
if x==y 
then return x 
else if x<y 
then do {writeSTRef b (y-x);loop a b} 
else do {writeSTRef a (x-y);loop a b}} 


习题 M 答案 ”当然 有 许多 答案 。 下 面 选择 的 是 用 9 个 数字 的 列表 [0 . .8 ] 表示 方块 的 


阵列 ， 其 中 0 表示 空位 。 为 了 避免 重复 计算 ， 一 个 位 置 用 一 个 二 元 组 (1 ， 睛 ) 表示 ， 其 中 
j 是 空位 在 态 中 的 位 置 , ks 是 [0 . .8] 的 置换 。 因 此 ， 有 


type Position = (Int, [Int]) 
data Move = Up | Down | Left | Right 


encode :: Position -> Integer 
encode (j,ks) = foldl op 0 ks 
Where op x d = 10*x + fromIntegral d 


start :: Position 
start = (0, [0..8]) 


子 数 moves 可 以 定义 为 


moves :: Position -> [Move] 
moves (j,ks) 
= [Up | j “notElem™ [6,7,8]] ++ 
[Down | j ‘notElem™ [0,1,2]] ++ 
[Left | j ‘notElem” [2,5,8]] ++ 
[Right | j “notElem” [0,3,6]] 


定义 说 明 ， 如 果 空 位 不 在 最 底 行 ， 则 允许 上 移 ; 如 果 空 位 不 在 最 项 行 ， 则 可 以 下 移 ; 如 末 
空位 不 在 最 右 列 ， 则 可 以 左 移 ; 如 果 空 位 不 在 最 左 列 ， 则 可 以 右 移 。 


函数 move 可 以 如 下 定义 : 


move :: Position -> Move -> Position 

move (j,ks) Up (j+3,swap (j,j+3) ks) 
move (j,ks) Down (j-3,swap (j-3,j) ks) 
move (j,ks) Left (j+1,swap (j,j+1) ks) 
move (j,ks) Right = (j-1,swap (ij-1,j) ks) 


swap (j,k) ks = ksl ++ y:ks3 ++ Xx:ks4 
Where (ksi,x:ks2) = splitAt j ks 
(ks3,y:ks4) = splitAt (k-j-1) ks2 


最 后 定义 : 


solved :: Position -> Bool 
solved p = P == (8, [1,2,3,4,5,6,7,8,0]) 
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我 的 计算 机 生成 如 下 结果 : 


gEhci> solve start 

Just [Left,Up,Right,Up,Left,Left,Down, 
Right ,Right ,Up,Left ,Down ,Down,Left, 
Up,Up,Right ,Right ,Down,Left,Left ,Up] 

(4.84 secs, 599740496 bytes) 


10.9 注 记 


请 阅读 《Haskell 的 历史 》 (The History of Haskell) 了 解 单 子 如 何 成 为 Haskell 不 可 分 
割 的 组 成 部 分 ， 以 及 为 什么 单子 思想 对 于 Haskell 实际 应 用 的 扩展 意义 重大 。 编 译 器 的 每 
个 阶段 都 使 用 单子 记录 信息 。 例 如 ， 类 型 检测 器 使 用 单子 结合 状态 (维护 当前 代 换 )、 名 
称 供应 (新 的 类 型 变量 名 ) 和 异常 。 

do 记 法 优先 于 ( >=>) 的 使 用 是 由 John Launchbury 在 1993 年 提出 的 建议 ， 并 由 
Mark Jones 第 一 次 在 Gofer 中 实现 。 

过 去 几 年 关于 单子 的 介绍 资料 不 断 增 加 ， 下 面 链接 给 出 比较 全 面 的 有 关 文 章 列表 : 

haskell. org/ haskellwiki/ Monad_tutorials 

单子 等 式 推理 的 例子 (习题 Ff) 参见 Jeremy Gibbons 的 论文 “Unifying theories of pro- 
gramming with monads”( UTP Symposium，August 2012 ) 。 更 多 有 关 单 子 等 式 推理 的 资料 参 
风 Jeremy Gibbons 和 Ralf Hinze 的 论文 “Just do it: simple monadic equational reasoning”， 该 
论文 刊登 在 2011 年 图 数 式 程序 设计 国际 会 议 (2011 International Conference of Functional 
Programming) 论文 集中 。 两 篇 论文 均 可 在 下 列 链接 找到 


WWW. Cs. Ox. ac. uk/ people/Jeremy. gibbons/ publications/ 
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句法 分 本 


一 个 句法 分 析 器 (parser) 是 对 一 个 文本 进行 分 析 以 确定 其 逻辑 结构 的 函数 。 文 本 是 
描述 人 们 感 兴趣 但 的 一 个 字符 串 ， 如 算术 表达 式 、 一 首 诗 或 者 一 个 数据 表 。 句 法 分 析 器 的 
结 采 是 对 该 值 的 一 种 表示 ， 如 算术 表达 式 的 分 析 结 果 是 某 种 树 ， 一 首 许 的 分 析 结 果 是 诗 行 
的 列表 ， 数 据 表 的 分 析 结 来 可 能 是 更 复杂 的 表示 。 许 多 程序 设计 任务 涉及 对 输入 用 某 种 方 
法 进行 分 析 ， 所 以 句法 分 析 是 计算 机 程序 设计 中 普遍 的 组 成 部 分 。 本 章 描 述 单子 式 的 句法 
分 析 ， 主 要 设计 各 种 表达 式 的 简单 句法 分 析 项 。 本 章 也 介绍 一 点 将 分 析 结 果 编 码 为 串 的 逆 
过 程 ， 换 言 之 ， 介 绍 关 于 Show 的 更 多 内 容 。 这 些 内 容 将 在 最 后 一 草 用 到 。 


11.1 单子 句法 分 析 铅 


句法 分 析 天 根据 需要 返回 不 同 的 值 ， 所 以 ， 可 以 先 把 句法 分 析 器 看 作 一 个 函数 输入 是 
串 ， 绪 果 是 茶 种 类 型 的 值 : 


type Parser a = String -> a 


这 个 类 型 基本 上 是 标准 引导 库 函 数 read 的 类 型 : 


read :: Read a => String -> a 


确实 ，read 就 是 一 个 句法 分 析 副 ， 只 是 它 不 够 灵活 。 一 个 原因 是 它 的 所 有 输入 必须 全 部 
消耗 掉 。 因 此 ， 有 

ghci> read "123" :: Int 

123 

ghci> read "123+51" :: Int 

水 冰冰 Exception: Prelude.read: no parse 

使 用 read 没有 明显 的 方法 完成 相继 读 两 个 或 者 更 多 的 输入 。 例 如 ， 可 能 需要 算术 表 
达 式 的 分 析 需 在 输入 中 先 找 出 一 个 数值 ， 然 后 是 一 个 运算 符 ， 接 着 是 另 一 个 数值 。 分 析 数 
值 的 第 一 个 分 析 岩 将 消耗 输入 的 某 个 前 绥 ， 分 析 运 算 符 的 第 二 个 分 析 器 消耗 剩余 输入 的 一 
个 前 级， 第 三 个 分 析 天 再 消耗 更 多 的 输入 。 一 个 更 好 的 想法 是 将 分 析 器 看 作 一 个 函数 ， 该 
盟 数 消耗 输入 的 一 个 前 级， 并 返回 一 个 期 望 的 值 和 未 消耗 的 输入 : 


type Parser a = String -> (a,String) 


这 个 类 型 还 不 够 周到 。 一 个 分 析 需 可 能 在 茶 些 输入 上 失败 。 构 造 可 能 失败 的 分 析 器 不 
是 一 个 错误 。 例 如 ， 对 于 算术 表达 式 的 分 析 嚣 ， 我 们 可 能 想 找 一 个 数值 或 者 一 个 左 括号 。 
一 个 分 析 融 或 者 辅助 分 析 带 中 的 一 个 将 会 失败 。 失 败 不 应 该 看 成 一 个 错误 ， 并 终止 分 析 进 
程 ， 而 是 应 该 看 成 一 个 在 两 种 可 能 性 间 的 选择 运算 的 单位 元 。 更 一 般 地 ， 一 个 分 析 咒 可 能 
找到 对 输入 的 茶 个 前 绥 的 不 同 分 析 结果 。 失 败 因此 对 应 于 分 析 结 果 是 空 序列 的 情况 。 为 了 
处 理 这 些 不 同 的 可 能 性 ， 我 们 将 定义 再 次 改 为 : 
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type Parser a = String -> [(a,String)] 


标准 引导 库 恰 好 提供 了 这 个 类 型 同义词 ， 只 是 在 那里 这 个 类 型 称 为 ReadS ， 不 是 Parser。 
而 且 ， 引 导 库 提供 了 一 个 函数 : 


reads :: Read a => ReadS a 


作为 类 族 Read 的 辅助 方法 。 例 如 : 


ghci> reads "-123+51" :: [(Int,String)] 
区 一 人 23 "51 
ghci> reads "+51" :: [(Int,String)] 


同 函 数 read 一 样 ， 使 用 reads 时 需要 说 明 期 望 的 类 型 。 上 面 的 第 二 个 例子 失败 ， 
返回 空 的 分 析 结 果 ， 因 为 一 个 Haskell 整数 前 面 可 以 冠 以 一 个 负 号 ， 但 是 不 可 以 也 以 加 号 。 
根据 定义 ， 如 果 一 个 分 析 器 对 于 所 有 的 可 能 情况 返回 空 或 者 单个 结果 的 列表 ， 则 称 为 确定 
的 (deterministic) 分 析 需 。 特 别 是 ，reads 的 特例 应 该 是 确定 的 分 析 徐 。 

必须 对 Parser 的 定义 做 进一步 的 修改 。 我 们 想 把 这 个 类 型 设置 成 类 族 Monad 的 实 
例 ， 但 是 目前 不 可 行 。 原 因 是 Parser 声明 为 类 型 同义词 ， 而 类 型 同义词 不 可 以 设置 成 任 
何 类 族 的 成 员 ， 它 们 只 能 继承 该 类 型 所 声明 的 任何 实例 。 类 型 同义词 只 是 为 了 改进 类 型 声 
明 的 可 读 性 ， 这 里 没有 任何 新 类 型 的 创建 ， 因 而 不 能 为 本 质 上 一 样 的 类 型 构造 两 个 不 同 的 
类 族 实例 。 

一 种 构造 新 类 型 的 方法 是 使 用 数据 声明 


data Parser a = Parser (String -> [(a,String)]) 


右边 的 标识 符 Parser 是 一 个 构造 当 数 ， 左 边 是 新 类 型 的 名 。 多 数 人 言 欢 这 种 双关 语 ， 也 
有 一 些 人 会 用 其 他 标识 符 命 名 构造 函数 ， 如 MkParser 或 者 只 用 P。 
为 Parser 构造 一 个 新 类 型 的 更 好 方法 是 利用 newtype 声明 : 


newtype Parser a = Parser (String -> [(a,String)]) 


到 目前 为 止 ， 还 没有 遇 到 需要 newtype 的 情况 ， 所 以 现在 先 对 此 做 些 解释 。 利 用 
data 声明 Parser 类 型 的 代价 是 查看 分 析 天 的 运行 必须 经 稼 用 构造 困 数 Parser 打包 和 
拆 包 ， 由 此 增加 分 析 句 的 运行 时 间 。 妇 外 ， 还 存在 一 个 无 用 的 Parser 元 素 ， 即 Parser 
undefined。 换 言 之 ，Parser a 与 String -> [(a,Sring)] 是 不 同 构 (isomorphic) 
的 类 型 。 认 识 到 这 一 点 后 ，Haskell 允许 用 newtype 声明 用 单个 构造 函数 和 单个 参数 构造 
的 类 型 。 它 与 类 型 同义词 类 型 的 不 同 在 于 ，newtype 构造 了 一 个 真正 的 新 类 型 ， 其 元 素 
必须 用 Parser 打包 。 这 些 强制 转换 虽然 必须 出 现在 程序 中 ， 但 是 并 没有 增加 程序 的 运行 
时 间 ， 因 为 编译 上 带 在 求 值 前 先 消去 了 包装 。 新 类 型 的 值 被 系统 地 用 底层 的 类 型 值 代 蔡 。 因 
此 ，Parser a 与 String -> [(a,String)] 描 述 了 同 构 的 类 型 ， 而且 Parser unde- 
fined 与 undefined 是 使 用 同一 个 表示 的 同 构 值 。 不 同 于 同义词 类 型 的 新 类 型 可 以 说 明 
为 类 族 的 成 员 ， 而 且 定 义 方法 可 不 同 于 底层 的 类 型 。 

无 论 使 用 哪 种 类 型 声明 ， 都 必须 提供 应 用 分 析 函 数 的 方法 ， 故 定义 : 


apply :: Parser a -> String -> [(a,String)] 
apply (Parser p) s= Ps 
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函数 apply 和 函数 Parser 是 互 道 的， 而且 是 同 构 映射 。 
也 可 定义 : 
parse :: Parser a -> String -> a 
parse p = fst . head . apply P 
函数 parse p 返回 第 一 次 分 析 的 第 一 个 结果 ， 如 果 分 析 妖 p 失败 ， 则 引起 错误 。 这 也 是 
唯一 可 能 发 生 错误 的 地 方 。 
现在 可 以 定义 : 
instance Monad Parser where 
return x = Parser (\s -> [(x,s)]) 
p>>=q = Parser (\s -> [(y,s'') 
| (x,s') <- apply p s, 
(yy8"") <-' :apply (q x} a]) 


在 pb >>= 9q 的 定义 中 ， 首 先 分 析 带 p 被 应 用 于 输入 串 ， 生 成 可 能 的 分 析 结 果 与 对 应 未 请 
耗 输入 二 元 组 列表 ; 然后 分 析 需 q 被 应 用 于 p 的 每 个 分 析 结 采 ， 生 成 可 能 结 采 列表 ， 并 将 
这 些 列表 串联 在 一 起 形成 最 后 结果 。 可 以 证 明 ，3 个 单子 律 成 立 。 证 明 留 作 练 习 。 


11.2 基本 分 析 器 
或 许 最 简单 的 分 析 需 是 
getc :: Parser Char 
getc = Parser f 
where f [] =: [] 
f (c:cs) = [(c,cs)] 


如 果 输 入 不 空 ， 这 个 分 析 右 返回 输入 的 第 一 个 字符 。 它 的 作用 恰 如 第 10 章 输入 -输出 单 
J vetChars 
下 一 个 分 析 器 识别 满足 给 定 条 件 的 一 个 字符 : 


sat :: (Char -> Bool) -> Parser Char 
sat p = do {c <- getc; 
if pc¢ then return c 
else fail} 


其 中 fail 定义 如 下 : 


fail = Parser (\s -> []) 


分 析 器 fail 是 男 一 个 不 返回 结果 的 基本 分 析 峰 。 分 析 带 sat p 读 一 个 字符 ， 如 果 该 字符 
满足 条 件 p， 则 返回 该 字符 作为 结果 。sat 的 定义 可 以 利用 一 个 称 为 guarad 的 小 组 合 间 
与 得 更 简 清 : 

sat p = do {c <- getc; guard (p c); return ch 


guard :: Bool -> Parser () 
guard True = return () 
guard False = fail 


要 检验 这 两 定义 是 一 致 的 ， 注 意 如 果 p c 不 真 ， 则 有 


guard (p c) >> return c = fail >> return c = fail 


法 分 让 7 


注意 定律 fail >> p = fail 的 应 用 ， 其 证 明 留 作 练 习 。 如 果 p c 为 真 ， 则 有 


guard (p c) >> return < 
= return () >> return c 
= return c 


利用 sat 可 以 定义 其 他 分 析 右 ， 例 如 : 


char :: Char -> Parser () 
char x = do {c <- sat (==x); return ()} 


string :: String -> Parser () 
string [] = return () 
string (x:xs) = do {char x; string xs; return ()} 


lower :: Parser Char 
lower = sat isLower 


digit :: Parser Int 
digit = do {d <- sat isDigit; return (cvt d)} 
Where cvt d = fromEnum d - fromEnum '0! 


分 析 器 char x 在 输入 串 中 查找 特定 的 字符 x， 分 析 器 string xs 查找 特定 的 串 ， 如 
果 成 功 ， 两 个 分 析 需 均 返 回 () 。 例 如 : 


ghci> apply (String "hell") "hello" 
La 


分 析 天 digit 查找 一 个 数字 字符 ， 并 在 成 功 的 情况 下 返回 对 应 的 整数 。 分 析 胡 lower 
查找 一 个 小 写字 母 ， 如 果 成 功 ， 则 返回 这 样 的 字符 。 


11. 3 选择 与 重复 


为 了 定义 更 复杂 的 分 析 器 ， 需 要 在 多 种 可 能 间 选 择 分 析 咒 的 运算 和 重复 一 个 分 析 絮 的 
运算 。 一 种 这 样 的 选择 运算 ( <1> ) 定义 为 
(<|>) :: Parser a -> Parser a -> Parser a 
p <|> q = Parser f 
where f s = let ps = apply p s in 


if null ps then apply 9 8 
else ps 


因此 p <1> gq 返回 p 的 分 析 结 果 ， 除 非 p 失败 。 对 于 p 失败 的 情况 ， 则 返回 g 的 分 析 结 
果 。 如 果 p 和 qa 都 是 确定 的 ， 那么 p <1> qa 也 是 确定 的 。 对 于 <1> 的 其 他 选择 ， 参 见习 
题 。 可 以 断言 ，<1> 满 足 结合 律 ， 单 位 元 为 fai1， 其 证 明 也 放 在 习题 中 。 

下 面 是 识别 一 串 小 写字 母 的 分 析 器 : 

lowers :: Parser String 


lowers = do {c <- Lower; cs <- lowers; return (c:cs)} 
<|> return "" 


要 理解 这 个 分 析 器 如 何 工 作 ， 假 定 输 入 是 串 “Upper "。 此 时 <1> 左 边 的 分 析 希 失败 ， 因 
为 “U” 不 是 小 写字 母 。 但 是 ， 右 边 的 分 析 怖 成 功 ， 所 以 有 


ghci> apply lowers "Upper" 
LC" Li "Upper")] 
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对 于 输入 “isUpper”， 左 边 分 析 髓 成 功 ， 故 有 

ghci> apply lowers "isUpper" 

[("is", "Upper")) 

选择 操作 符 <1 > 的 使 用 需要 谨慎 。 例 如 ， 考 虑 一 个 非常 简单 的 算术 表达 式 ， 表 达 式 或 
者 是 一 位 数字 ,或 者 是 一 个 数字 后 接 一 个 加 号 ， 再 接 为 一 个 数字 。 下 面 是 一 个 可 能 的 分 
析 明 : 

wrong :: Parser Int 


wrong = digit <|> addition 


addition :: Parser Int 
addition = do {m <- digit; char '+'; n <- digit; 
return (m+n)} 

有 下 列 结果 : 

ghci> apply wrong "1+2" 

[(1,"+2")] 

分 析 器 digit 成 功 ， 故 addition 没有 执行 。 但是, 我 们 真正 想 要 的 是 返回 
[(3,"") ] ， 以 得 到 尽 可 能 多 的 输入 。 纠 正 wrong 的 一 种 方法 是 重 写 定 义 如 下 : 


better = addition <|> digit 


此 时 对 于 输入 1+2， 分析 妖 addition 成功， 返回 了 我 们 想 要 的 结果 。better 存在 的 
问题 是 它 的 效率 低 : 将 分 析 需 应 用 于 输入 1 时 分 析 数 字 成 功 ， 但 是 如 果 没 有 找到 后 续 的 加 
号 ， 所 以 分 析 器 addition 失败 。 结 果 是 digit 被 激活 ， 输 入 又 一 次 被 从 头 开 始 分 析 。 
这 对 一 位 数字 不 是 问题 ， 但 是 如 果 要 对 一 个 可 能 包含 很 多 位 的 数值 进行 分 析 ， 那 么 重复 的 
工作 量 会 很 大 。 

最 好 的 解决 方法 是 将 两 个 分 析 需 分 量 中 的 数字 分 析 融 提取 出 来 : 


best = digit >>= rest 
rest m = do {char '+'; n <- digit; return (m+n)} 
<|> return m 


rest 的 参数 仅仅 是 一 个 累积 参数 。 这 个 方法 基本 上 是 第 8 章 介绍 的 方法 。 提 取 分 析 天 得 
到 一 个 公共 前 缀 是 改进 效率 的 好 主意 。 
推广 lowers 的 定义 ， 可 以 定义 一 个 分 析 需 组 合 食 ， 用 于 重复 一 个 分 析 舌 0 次 或 者 


many :: Parser a -> Parser [a] 
many p = do {x <- p; xs “- many p; return (x:xs)} 


<|> none 


none = return [] 


值 none 不 同 于 fail (为 什么 ?)。 现 在 可 以 定义 : 


lowers = many lower 


在 许多 应 用 中 ， 所 谓 的 空白 (white space) (空格 序列 、 换 行 符 和 制 表 符 ) 可 以 出 现 
在 标记 (tokens) (标识 符 、 数 值 、 左 括号 和 右 括 号 等 ) 之 间 以 增强 文本 的 可 读 性 。 分 析 
胡 space 用 于 识别 空白 : 


多 法 分 析 189 


space :: Parser () 
space = many (sat isSpace) >> return () 


卫 数 isspace 定义 在 Data .char 中 。 下 列 函 数 在 识别 一 个 给 定 串 前 忽略 空 日 : 


Symbol :: String -> Parser () 
symbol xs = space >> string xs 


更 一 般 地 ， 可 以 定义 在 激活 一 个 分 析 各 前 忽略 空 日 : 


token :: Parser a -> Parser a 
token p = space >> P 
注意 到 


token p <|> token q = token (p <|> qd) 


但 是 右边 的 分 析 屁 更 高 效 ， 因 为 如 果 第 一 个 分 析 器 失败 时 ， 它 不 会 重复 查找 空 晶 。 
有 时 需要 重复 一 个 分 析 器 一 次 或 者 多 次 ， 而 不 是 0 次 或 者 多 次 。 这 个 功能 可 以 利用 称 为 
some (有 的 分 析 库 称 之 为 manyl ) 的 组 合 占 实现 : 


some :: Parser a -> Parser [al 
some p = do {x <- p; xs <- many p; return (x:xs)} 


这 个 定义 重复 了 many 定义 中 选择 运算 的 第 一 个 分 析 器 ， 利 用 这 个 事实 也 可 以 重新 用 
some 定义 many: 
many :: Parser a -> Parser [al] 


many p = optional (some p) 


optional :: Parser [a] -> Parser [al] 
optional p = p <|> none 


现在 分 析 硕 some 和 many 是 相互 递归 的 。 
下 面 是 一 个 目 然 数 分 析 硕 ， 人 允许 数字 前 面 有 空 日 : 


natural :: Parser Int 
natural = token nat 
nat = do {ds <- some digit; 
return (foldli shift] ds)} 
Where Shiftl m n = 1i0*m+n 


辅助 的 分 析 帮 nat 不 允许 数字 前 面 有 空 日 。 

现在 考虑 如 何 定义 一 个 整数 分 析 器 ， 根 据 定 义 整 数 是 一 个 非 空 数字 串 ， 前 面 可 能 有 负 
号 。 谈 者 可 能 设想 下 面 的 分 析 需 可 行 : 

int :: Parser Int 


int = do {symbol "-"; n <- natural; return (-n)} 
<|> natural 


但 是 其 效率 低 (见习 题 H)， 而 且 或 许 结 果 不 是 我 们 期 望 的 。 例 如 : 


© 


ghci> apply int " -34" 
[(-34,"")] 
ghci> apply int " - 34" 
[C=34;"")] 


数字 前 的 空 日 没有 任何 问题 ， 但 是 我 们 不 希望 在 一 个 数字 和 它 的 负 号 中 间 有 空 日 。 如 
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条 是 这 样 ， 以 上 分 析 需 便 有 问题 。 容 易 修 改 int 的 定义 以 给 出 我 们 希望 的 定义 : 


int :: Parser Int 
int = do {symbol "-"; n <- nat; return (-n)} 
<|> natural 


这 个 分 析 融 仍然 是 低 效 的 ， 更 好 的 方法 是 定义 : 


int :: Parser Int 

int = do {space; f <- minus; n <- nat; return (f n)} 
where 

minus = (char '-' >> return negate) <|> return id 


分 析 器 minus 返回 一 个 也 数 ， 如 果 第 一 个 符号 是 负 号 ， 则 该 函数 是 negate， 否 则 是 恒 
等 图 数 。 

下 面 再 识别 中 间 用 逗号 分 隔 ， 两 边 用 方 括号 围 起 来 的 一 个 整数 列表 。 假 设 每 个 逗号 和 
括号 前 后 都 允许 有 空白 ， 当 然 一 个 整数 的 数字 中 间 不 可 有 空白 。 以 下 是 一 个 简短 定义 : 


ints :: Parser [Int] 
ints = bracket (manywith (Symbol ",") int) 


辅助 分 析 需 bracket 用 来 处 理 括号 : 
bracket :: Parser a -> Parser a 
bracket p = do {symbol "["; 

x <= pp; 

symbol a 二 

return x} 


函数 manywith sep p 有 些 像 many p, 不 同 之 处 在 于 p 的 实例 是 由 sep 的 实例 分 隅 
的 ， 后 者 的 结果 被 忽略 。 其 定义 如 下 : 
manywith :: Parser b -> Parser a -> Parser [a] 


manywith q p = optional (somewith q p) 


somewith :: Parser b -> Parser a -> Parser [al 
somewith q p= do {x <- p; 
xs <- many (q >> p); 
return (x:xs)} 


例如 : 


ghci> apply ints "[2, -3, 4]" 
LL2,"3,A] ,""*)] 

ghci> apply ints "[2, -3, +4]" 
[] 


ghci> apply ints "[]" 
DU 


整数 前 面 不 能 冠 以 加 号 ， 所 以 第 二 个 表达 式 的 解析 失败 。 


11.4 语法 与 表达 式 


到 目前 为 止 ， 所 介绍 的 组 合 运 算 足 以 将 所 要 求 的 结构 描述 翻译 成 函数 分 析 胡 。 这 种 结 
构 描 述 用 一 个 语法 (grammar) 提供 。 下 面 将 通过 各 种 算术 表达 式 的 分 析 器 来 展示 一 些 典 
型 的 语法 。 

首先 构建 下 面 定义 的 类 型 Expr 的 分 析 需 : 
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data Expr = Con Int | Bin Op Expr Expr 
data 0P = Plus | Minus 


下 面 是 一 个 完全 使 用 括号 的 语法 ， 用 所 谓 的 巴 科 斯 -诺尔 范 式 〈Backus- Naur form ) ， 
简称 BNF : 


expr ::= nat | '(' expr op expr ')' 
op :二 11+! | 人 

nat  ::= {digit}+ 

i em Or | WI | | 9 


这 个 语法 定义 了 4 个 语法 范 (syntactic categories) 。 引 号 中 的 符号 称 为 终结 (terminal) 
符 ， 而 且 符号 本 里 是 自 描述 的 。 这 些 符 号 是 实际 出 现在 文本 中 的 符号 。 数 字符 号 有 10 种 
可 能 , 一 个 nat 定义 为 一 个 或 者 多 个 数字 的 序列 。 元 符号 { - } + 描述 一 个 语法 范畴 的 非 
零 次 重复 。 注 意 ， 这 里 不 允许 在 数字 序列 前 出 现 可 选 的 负 号 ， 所 以 ， 和 前 数 是 目 然 数 ， 不 是 
任意 整数 。 语 法 表明 ， 一 个 表达 式 或 者 是 一 个 上 自然数， 或 者 是 一 个 复合 表达 式 ， 其 构成 是 
左 括号 后 接 一 个 表达 式 ， 然 后 是 一 个 加 号 或 者 减 号 ， 接 着 是 另 一 个 表达 式 ， 最 后 是 右 括 
号 。 对 描述 的 隐 含 理解 为 终结 符 之 间 的 空白 可 以 忽略 ， 但 是 一 个 数 的 数字 间 的 空格 不 能 忽 
略 。 这 个 语法 可 以 直接 翻译 成 表达 式 的 分 析 需 : 
expr :: Parser Expr 
expr = token (constant <|> paren binary) 
constant = do {n <- nat; return (Con n)} 
binary = do {el <- expr; 
Pp <- op; 
e2 <- expr; 
return (Bin p el e2)} 


op = (symbol "+" >> return Plus) <|> 
(Symbol "~-" >> return Minus) 


为 了 增加 可 读 性 ， 引 入 辅助 分 析 器 pijnary。 分 析 器 paren 的 定义 留 作 练 习 。 

假定 需要 一 个 能 够 识别 省 略 括号 的 表达 式 ， 如 6-2-3、6-(2-3) 和 (6-2) -3 
等 。 此 时 ， 表 达 式 中 的 (+) 和 (=-) 应 该 左 结合 ， 就 像 普 通 的 算术 表达 式 一 样 。 用 
BNF 表达 这 种 语法 的 一 种 方法 如 下 : 

expr ::= expr op term | term 

term ::= nat | '(' expr ')' 
这 个 语法 表示 ， 一 个 表达 式 是 一 个 项 或 者 项 之 间 用 运算 符 分 隔 的 多 个 项 的 序列 。 一 个 项 或 
者 是 一 个 数 ， 或 者 是 一 个 用 括号 包围 的 表达 式 。 特 别 是 ，6 -2 -3 将 被 分 析 成 表达 式 6 -2 
后 接 一 个 减 号 ， 然 后 再 接 项 3。 换 句 话 说， 结果 等 同 于 (6 -2) -3， 这 也 是 我 们 要 求 的 。 
这 个 语法 也 可 以 直接 翻译 成 一 个 分 析 器 : 


expr = token (binary <|> term) 
binary = do {el <- expr; 

P <- op; 

e2 <- term; 

return (Bin p el e2)} 
term = token (constant <|> paren expr) 


但 是 ， 这 个 分 析 器 有 一 个 致命 问题 ， 它 会 陷入 无 穷 循 环 。 分 析 器 expr 的 第 一 个 动作 首先 
忽略 空白 ， 然 后 调用 binary， 而 binary 的 第 一 个 动作 又 是 调用 expr。 糟 糕 1 
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另外 ， 如 下 定义 expr 是 不 可 行 的 。 


expr = token (term <|> binary) 


因为 ， 例 如 : 

Main*> apply expr "3+4" 

[(Con 3,"+4")] 
只 有 第 一 个 项 被 识别 。 这 种 问题 称 为 堪 递 归 (left recursion) 问题 ,而且 是 所 有 递归 分 析 
需 会 遇 到 的 问题 ， 包 括 困 数 式 的 以 及 其 他 的 分 析 策 。 

一 个 解决 方法 是 用 下 列 等 价 形式 重 写 语法 : 


expr ::= term {op term}* 


其 中 的 元 符号 { - }* 表示 一 个 语法 范畴 被 重复 0 次 或 者 多 次 。 此 时 新 的 分 析 侣 具有 下 列 
形式 : 
expr = token (term >>= rest) 
rest el = do {p <- op; 
e2 <- term; 
rest (Bin p el e2)} <|> return el 
分 析 船 rest 对 应 于 范畴 {op term}* ,而 且 它 有 一 个 参数 ( 累积 参数 )， 其 值 是 当前 分 
析 的 结果 。 
最 后 ， 设 计 一 个 算术 表达 式 的 分 析 融 ， 表 达 式 可 以 包含 乘法 和 除法 ， 并 如 下 修改 Op 
的 定义 : 
data Op = Plus | Minus | Mul | Div 
采用 普通 的 运算 规则 ， 乘 法 和 除法 优先 级 高 于 加 法 和 减法 的 优先 级 ， 相 同 优先 级 的 运算 问 
左 结 合 。 下 面 是 语法 : 


expr ::= term {addop term}* 


term ::= factor {mulop factor}* 
factor ::= nat | '(' expr ')' 
addop Y= "+ | "=" 
Lop Sum "wt | VA 

其 分 析 需 如 下 : 


expr = token (term >>= rest) 
rest el = do {p <- addop; 
e2 <- term; 
rest (Bin p el e2)} 
<|> return el 
term = token (factor >>= more) 
more el = do {p <- mulop; 
e2 <- factor; 
more (Bin p el e2)} 
<|> return el 
factor = token (constant <|> paren expr) 


分 析 需 addop 和 mulop 的 定义 留 作 习题 K。 


11.5 显示 表达 式 
最 后 一 个 问题 是 ， 如 何 将 Expr 设置 成 类 族 Show 的 成 员 ， 使 得 函数 show 成 为 语法 
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分 析 的 逆 函 数 ? 更 确切 地 说 ， 定 义 show 使 得 


parse expr (Show e) = e 


注意 ，parse p 抽取 由 apply p 返回 的 第 一 个 分 析 结 果 。 


作为 热身 准备 ， 下 面 是 Expr 作为 Show 的 实例 定义 ,假定 expr 是 只 包含 加 减 运算 


及 完全 插 号 表达 式 的 分 析 梧 : 


instance Show Expr where 
show (Con n) = show n 
show (Bin op el e2) = 
= "(" ++ Show el ++ 
"” "++ showop op:++ 
nn Bhow 2 hh 
showop Plus = "+" 
showop Minus = "-—" 


定义 很 清楚 , 但 是 效率 有 问题 。 因 为 ( ++) 的 运行 时 间 是 其 左边 参数 的 线性 函数 ， 


以 ， 在 最 坏 情 况 下 show 的 求 值 运 行 时 间 是 表达 式 规模 的 二 次 方 函数 。 


解决 方法 仍然 是 使 用 累积 参数 。Haskell 提供 了 一 个 类 型 别名 Shows: 


type ShowS = String -> String 


以 及 下 列 辅助 函数 : 
showChar :: Char -> ShowS 
ShowString :: String -> ShowS 
ShowParen :;: Bool -> ShowS -> ShowS 
这 些 函 数 定 义 如 下 : 
showChar = (:) 
showString = (++) 
showParen b p = if b then 
showChar '(' . P . showChar ')' 
else p 


现在 可 以 给 出 表达 式 的 show 函数 如 下 : 
Show e = shows e@ "" 
where 
shows (Con n) = ShowString (Show n) 
shows (Bin op el e2) 
= showParen True (shows el . showSpace . 


showsop op . showSpace . shows e2) 
showsop Plus = showChar '+' 
showsop Minus = showChar '—' 
showSpace = showChar ' ' 


这 个 版 本 没有 显 式 使 用 串联 运算 ， 运行 时 间 是 表达 式 规模 的 线性 函数 。 
假如 现在 要 显示 省 略 括号 的 表达 式 。 左 边 表达 式 的 括号 可 以 省 略 ， 但 是 右边 表达 式 的 


括号 则 不 能 省 略 。 由 此 得 到 
Show = shows False e "" 
where 
shows b (Con n) = showString (show n) 
shows b (Bin op el e2) 
= showParen b (shows False el . showSpace . 
showsop op . showSpace . shows True e2) 
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这 个 定义 没有 考虑 到 结合 性 ， 例 如 ，1 + (2 +3) 的 显示 结果 不 是 1 +2 +3。 

最 后 ， 考 虑 包含 所 有 4 种 运算 的 表达 式 。 这 里 的 区 别 在 于 : 

1. 对 于 表达 式 el + e2 或 者 el - e2, 无 需 在 el 周围 加 括号 (同上 面 情况 一 样 )， 
如 果 e2 是 一 个 以 乘法 或 除法 为 根 运 算 的 复合 表达 式 ， 那 么 e2 周围 也 不 需要 加 括号 。 

2. 另 一 方面 ， 对 于 表达 式 el *e2 或 者 el / e2 ， 如 果 el 是 根 运算 为 加 法 或 者 减法 
的 表达 式 ， 需 要 在 el 周围 加 括号 ， 而 且 e2 周围 总 是 需要 加 括号 。 

对 这 些 规 则 编码 的 一 种 方法 是 引入 优先 级 (为 一 种 方法 见习 题 L)。 定 义 : 

prec :: Op -> Int 

prec Mul = 

prec Div 


prec Plus 
prec Minus 


ND 


现在 考虑 如 何 定 义 下 列 类 型 的 函数 showsPrec: 


showsPrec :: Int -> Expr -> ShowS 


使 得 showsPrec p e 能 够 显示 表达 式 e， 假 定 e 的 父 结 点 是 优先 级 为 p 的 运算 的 复合 表 
达 式 。 然 后 明 数 show 可 以 定义 为 


show e = showsPrec 0 e@ "" 


使 得 围 纯 @ 的 上 下 文 (context) 是 一 个 假想 优先 级 0 的 运算 。 马 上 可 以 定义 : 


showsPrec p (Con n) = showString (show n) 


因为 常数 永远 不 需要 括号 。 有 趣 的 是 复合 表达 式 的 情况 ， 这 里 先 给 出 定义 ， 然 后 再 
解释 : 

showsPrec p (Bin op el e2) 

= showParen (p>q) (showsPrec q el . showSpace . 


showsop op . showSpace . showsPrec (q+1) e2) 
where q = prec op 


如 果 父 运算 符 的 优先 级 高 于 当前 运算 优先 级 ， 则 在 一 个 表达 式 周 围 加 插 号 。 要 显示 表达 式 
el ， 只 需 将 当前 优先 级 作为 新 的 父 优先 级 传递 下 去 。 但 是 ， 如 果 e2 的 根 运 算 优 先 级 低 于 
或 者 等 于 q， 则 在 e2 周围 需要 加 括号 ， 所 以 在 第 二 次 调用 中 对 ga 加 1。 

不 可 否认 的 是 ，showsPrec 的 以 上 定义 需要 一 些 思考 ， 但 这 也 是 值得 的 。 类 族 
Show 有 第 二 个 方法 ， 即 showsPrec。 而 且 ，show 的 缺 省 定义 正 是 如 上 的 定义 。 所 以 ， 
将 表达 式 作 为 Show 的 成 员 ， 只 需 给 出 showsPrec 的 定义 即 可 。 


11.6 习题 
习题 A 考虑 类 型 同义词 : 


type Angle = Float 
假设 在 Angle 上 和 定义 的 相等 为 模 2 的 茶 个 倍数 相等 。 请 问 为 什么 不 能 用 ( == ) 进行 这 
样 的 测试 ? 再 考虑 : 


newtype Angle = Angle Float 


请 定义 Angle 为 Ed 的 成 员 , 使 得 ( == ) 可 用 来 判断 两 个 Angle 元 素 是 否 相 等 。 
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习题 B 可 以 定义 : 


newtype Parser a = Parser (String -> Maybe (a,String)) 


请 给 出 这 种 分 析 器 的 单子 实例 定义 。 
习题 C 证 明 fail >>p = fail。 
习题 D ”可否 如 下 定义 <1>? 


p <|> q = Parser (\s -> parse p s ++ parse q 8s) 


在 什么 情况 下 结果 是 一 个 确定 的 分 析 器 ? 请 定义 一 个 函数 : 


limit :: Parser a -> Parser a 


使 得 即使 p 和 a 不 是 确定 的 ，1limit (p <1> q) 也 是 一 个 确定 的 分 析 器 。 
习题 E 分 析 器 不 仅 是 单子 的 实例 ， 也 可 以 是 之 前 介绍 的 、 更 局 限 的 称 为 Monad- 
Plus 类 族 的 实例 。 它 们 基本 上 是 支持 选择 和 失败 的 单子 。Haskell 定义 为 


class Monad m => MonadPlus m Where 
mzero :: ma 
mplus :: ma->ma->ma 


例如 ， 列 表 类 型 构造 函数 [] 和 Maybe 都 可 以 定义 为 MonadPlus 的 实例 : 


instance MonadPlus [] where 
mzero = [] 
mplus = (++) 


instance MonadPlus Maybe where 
mzero = Nothing 
Nothing ‘mplus ~ y= 了 
Just x ‘mplus  y = Just x 
请 将 Parser 定义 为 MonadPlus 的 实例 。 
习题 F ”接着 习题 上 ， 新 的 方法 mzero 和 mplus 应 该 满足 一 些 等 式 定 律 ， 就 像 通常 
一 个 类 族 的 方法 一 样 。 但 是 ， 目 前 Haskell 设计 者 对 于 这 些 方 法 应 该 满足 的 确切 定律 没有 
一 致意 见 。 没 有 争议 的 定律 是 mplus 具有 单位 元 mzero， 并 且 满 足 结合 律 。 由 此 得 到 3 
条 定律 。 为 一 条 合理 的 定律 是 左 零 元 (left-zero) 律 : 
mzero >>= f = mzero 
相应 的 右 零 元 (right-zero) 律 也 应 该 满足 : 


P >> mzero = mzero 


请 问 列表 单子 作为 MonadPlus 的 实例 满足 这 5 条 定律 吗 ? 
最 后 ， 真 正 有 争议 的 定律 是 下 面 的 等 式 : 


(p ‘mplus™ q) >>= f = (p >>= f) “mplus” (gq >>= f£) 


这 条 定律 称 为 左 分 配 (left-distribution) 律 。 如 果 要 求 满足 左 分 配 律 ， 那 么 Maybe 为 什么 
不 能 成 为 MonadPlus 的 成 员 ? 

习题 G ”设计 一 个 识别 Haskell 浮 点 数 的 分 析 器 。 记 住 ，. 314 不 是 合法 的 数字 (小 数 
点 前 没有 数字 ) ， 而 且 3. 4 也 是 不 合法 的 (小 数 点 前 后 不 允许 空白 )。 

习题 H 对 比 int 的 3 个 定义 ,为 什么 本 书 中 int 的 第 一 个 定义 和 第 二 个 定义 是 低 
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效 的 ? 

习题 | 请 问 " (3 ) "是 括号 完全 的 表达 式 吗 ? 它 是 省 略 括号 的 表达 式 吗 ? Haskell 允许 
稍 数 市 括号 : 

ghci> (3)+4 

7 

请 设计 一 个 括号 完全 的 表达 式 分 析 需 ， 而 且 人 允许 在 稼 数 周围 加 括号 。 

习题 J 考虑 语法 expr :: = term {op term}* 。 请 定义 pair 和 shunt 使 得 下 
列 分 析 需 是 合理 的 : 


expr = do {el <- term; 
pes “- many (pair op term) ; 
return (foldl shunt el pes)} 


习题 K ”请 给 出 addop 和 mulop 的 定义 。 

习题 L 再 考虑 包含 4 种 算术 运算 的 表达 式 的 显示 问题 。 使 用 插 号 的 规则 :在 表达 式 
el op e2 中 ， 如 果 op 是 乘法 运算 符 , 而 且 el 的 根 不 是 乘法 运算 符 ， 则 在 el 周围 需要 
括号 。 对 偶 地 ， 如 果 op 是 乘法 运算 符 ， 或 者 e2 的 根 不 是 乘法 运算 符 ， 那 么 e2 周围 需要 
括号 。 定 义 : 

isMulOp Mul = True 


isMulDp Div = True 
isMulDp . = False 


请 构造 show 的 男 一 个 定义 ， 并 使 用 下 列 辅 助 函 数 : 


showsF :: (0p -> Bool) -> Expr -> ShowS 


11.7 答案 
习题 A 答 案 因为 (==) 是 浮 点 数 上 的 相等 测试 ， 不 同 的 浮 点 数 不 相 等 。 


instance Eq Angle where 
Angle x == Angle y = reduce x == Teduce y 
where 
reduce x | x<0 = reduce (x + 工 ) 
| x>r = reduce (x - IT) 
| otherwise = x 
Where r = 2*pi 


习题 B 答案 


instance Monad Parser where 
return x = Parser (\s -> Just (x,s)) 
P >>= q = Parser (\s' -> case apply p s of 
Nothing -> apply qs 
Just (x,s') -> Just (x,s')) 


习题 C 答案 


fail >> P 
= fail >>= const P 
= fail 


根据 fail 的 定义 和 p >>= qa 的 定义 立即 可 以 得 出 fail >>= p = fail 的 事实 。 


法 分 机 2 


习题 D 答案 ”是 的 ， 可以, 但 是 只 有 当 p 或 者 gq 是 fail 时 ,结果 才 是 确定 的 。 函 数 
limit 可 以 如 下 定义 ， 


limit P = Parser (take 1 . apply P) 


习题 E 答案 
mzero = fail 
mplus = (<|>) 


习题 F 答 案 ”是 的 ， 列表 单子 和 Maybe 单子 均 满足 这 5 条 定律 。 例 如 ， 对 于 列表 
单子 : 


mzero >>= f = concat (map f []) = [] = mzero 
xs >> mzero = concat (map (const []) xs) = [] = mzero 


对 于 Maybe， 左 分 配 律 不 成 立 。 因 为 


(Just Xx“mplus”q) >>= (\x -> Nothing) 
Just x >>= (\x -> Nothing) 
Nothing 


但 是 


(Just x >> \x -> Nothing) “mplus 

(gq >>= \x -> Nothing) 

Nothing ‘mplus” (q >>= \x -> Nothing) 
= q >>= \x -> Nothing 


两 个 结果 表达 式 不 相等 (take q = undefined)。 


习题 G 答案 

float :: Parser Float 

float = do {ds <- some digit; 
char "oi 


fs <- some digit; 
return (foldl shiftl 0 ds + 
foldr shiftr 0 fs)} 
Where Shiftl n d = i0*n + fromIntegral d 
shiftr f x = (fromIntegral f+x)/10 


分 析 帮 digit 返回 一 个 Int ， 这 个 Int 必须 转换 成 一 个 数 (在 这 里 是 Float )。 
习题 H 答案 空 日 被 分 析 了 两 次 。 例 如 ， 用 int1i 和 int3 分 别 表示 第 一 个 和 第 三 个 
版 本 ， 则 有 


ghci> apply int3 $ replicate 100000 ! ' ++ "3" 
[E(3, i ")] 

(1.40 secs, 216871916 bytes) 

ghci> apply intl $ replicate 100000 ' ' ++ "3" 
LB 


(2.68 secs, 427751932 bytes) 


习题 | 答案 不 是 ,根据 expr 的 第 一 个 语法 ， 只 有 二 元 表达 式 可 以 用 括号 。 是 的 ， 
根据 第 二 个 定义 ,任何 表达 式 都 可 以 用 括号 围 起 来 。 


修改 后 的 语法 是 
expr ::= term | '(' expr op expr ')' 


term := nat | '(* expr ')" 
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296| 相应 的 分 析 盏 是 


expr = token (term “|> paren binary) 
where 
term = token (constant <|> paren expr) 
binary = do {ei <- expr; 

Pp <- op; 

e2 <- expr; 

return (Bin p el e2)} 


习题 J 答案 


pair :: Parser a -> Parser b -> Parser (a,b) 
pair pq= do {x <- p; y <- qi return (x,y)} 


shunt el (p,e2) = Bin p el e2 


习题 K 答案 
addop = (symbol "+" >> return Plus) <|> 
(symbol "-" >> return Minus) 


mulop = (symbol "*"* >> return Mul) <|> 
(Symbol "/" >> return Div) 


习题 上 答案 


Show e = showsF (const False) e "" 

where 

showsF f (Con n) = showString (Show n) 

showsF f (Bin op el e2) 

= showParen (f op) (showsF fl el . showSpace . 
showsop op . showSpace . showsF f2 e2) 
Where fl x = isMul0P op && not (isMulOp x) 
f2 x = isMul0p op || not (isMulOp x) 


11.8 注 记 


用 单子 方式 设计 函数 式 语法 分 析 融 一直 以 来 都 是 很 受 欢迎 的 函数 式 程序 设计 的 应 用 。 
本 划 的 内 容 沿 用 Graham Hutton 和 Erik Meijer 的 “Monadic parsing in Haskell”， 参 见 the 
Journal of Functional Programming8(4) ，437-144 ，1998 。 


| 第 12 章 


Thinking Functionally with Haskell 


一 个 简单 的 等 式 计算 般 





最 后 一 章 介 绍 一 个 程序 设计 项 目 ， 设 计 并 实现 一 个 执行 点 自由 等 式 证 明 的 简单 计算 
需 。 尽 管 计 算 顺 只 提供 一 个 自动 证 明 辅 助 硕 中 部 分 的 功能 ， 并 在 许多 方面 很 局 限 ， 但 
是 ， 这 个 计算 器 足以 证 明之 前 描述 的 许多 点 自由 定律 ， 当 然 ， 只 要 我 们 准备 好 在 必要 的 
时 候 在 正确 的 方向 上 助 其 一 臂 之 力 。 本 项 目 也 是 使 用 模块 系统 的 实例 。 计 算 需 的 每 个 组 
成 部 分 ， 相 关 类 型 和 函数 ， 都 定义 在 一 个 适当 的 模块 中 ， 并 通过 显 式 的 输入 和 输出 关联 
模块 。 


12.1 基本 思想 
基本 想法 是 设想 具有 下 列 类 型 的 函数 calculate: 


calculate :: [Law]j -> Expr -> Calculation 


图 数 calculate 的 第 一 个 参数 是 可 能 应 用 的 定律 列表 。 每 个 定律 由 一 个 描述 性 的 名 
称 和 一 个 方程 组 成 。 第 二 个 参数 是 一 个 表达 式 ， 结 果 是 一 个 计算 。 一 个 计算 由 一 个 开始 表 
达 式 和 一 系列 步骤 构成 。 每 一 步 由 一 个 定律 的 名 和 将 该 定律 左边 应 用 于 当前 表达 式 得 到 的 
表达 式 构成 。 当 没有 定律 可 用 时 ,计算 结束 ， 最 后 的 表达 式 便 是 计算 的 结果 。 整 个 过 程 是 
自动 的 ， 无 需 用 户 参 与 。 

定律 、 表 达 式 和 计算 都 是 将 在 下 面 几 节 定义 的 适当 数据 类 型 的 元 素 。 不 过 ， 现 在 先 插 
人 入 一 个 例子 ,说 明 心 目 中 的 框架 。 

下 面 是 几 个 定律 〈 使 用 小 字体 避免 断 行 ) : 


definition filter: filter p = concat . map (box p) 


definition box: box p = if p one ni 

if after dot: if peEe hs (pe EE h-hh 
dot after if: ss 

nil constant: Dl nl 

map after nil: map £f . nil = nil 

map after one: map f . one = one .ff 

map after concat: map f . concat = concat . map (map £) 
map functor: map f .map 区 = map (f . g) 

map functor: map id = id 


每 个 定律 由 一 个 名 和 一 个 等 式 构成 。 定 律 的 名 用 冒号 表示 结束 ， 一 个 等 式 由 两 个 表达 
式 中 间 用 等 号 分 隔 表 示 。 每 个 表达 式 描 述 一 个 函数 ， 计 算 器 只 用 于 简化 这 些 函 数 表 达 式 
(是 的 ， 是 点 自由 计算 器 ) 。 表 达 式 由 常数 (如 one 和 map) 和 变量 (如 工 和 g) 构成 。 
确切 的 语法 将 在 适当 的 时 候 说 明 。 注 意 ， 没 有 条 件 定律 ， 即 只 有 在 某 些 辅助 条 件 满足 的 条 
件 下 成 立 的 等 式 。 这 将 限制 计算 絮 所 能 做 的 工作 ， 但是， 这 个 计算 器 仍然 是 非常 有 趣 的 。 
假如 要 简化 表达 式 filter p . map f。 以 下 是 一 种 可 能 的 计算 : 
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filter p . map 工 
= {definition filter} 
concat . map (box p) . map f 
= {map functor} 
concat . map (box p . 工 ) 
= {definition box} 
concat . map (if p one nil . f) 
= {if after dot} 
concat . map (if (p . f) (one . f) (nil . £)) 
= {nil constant} 
concat . map (if (p . f) (one . f) nil) 


计算 步骤 用 常规 方式 显示 ， 所 使 用 的 定律 写 在 括号 中 ， 并 放 在 它 应 用 的 表达 式 之 间 。 
没有 定律 可 以 应 用 于 最 后 的 表达 式 ， 该 表达 式 就 是 计算 的 结果 。 显 然 ， 结 采 不 比 开始 要 化 
简 的 表达 式 人 简单 。 
计算 器 有 可 能 以 不 同 的 顺序 应 用 某 些 定律 。 例 如 ，pox 的 定义 可 以 在 第 二 步 使 用 ， 而 
不 是 在 第 三 步 使 用 。 但 是 ， 最 后 的 结果 是 相同 的 。 也 有 可 能 ， 尽 管 不 是 这 组 定律 ， 一 个 表 
达 式 用 不 同 的 计算 得 到 不 同 的 结果 。 但 是 ， 从 一 开始 我 们 就 决定 calculate 返回 一 个 结 
果 ， 而 不 是 所 有 可 能 计算 组 成 的 树 。 
注意 每 一 步 计算 在 发 生 什 么 。 茶 个 定律 的 左边 与 当前 表达 式 的 某 个 子 和 表达 式 进 行 匹 
配 。 如 果 匹 配 成 功 ， 那 么 结果 是 定律 中 变量 的 代 换 〈substitution ) 。 例 如 ， 在 第 二 步 中 ， 子 
表达 式 map (box p) . map f 与 第 一 个 map 图 子 律 成 功 匹 配 ， 结 果 是 一 个 代 换 ， 其 中 
map 函 子 律 中 的 变量 f 绑 定 到 box p， 变 量 g 绑 定 到 E。 这 一 步 的 结果 是 重 写 子 表达 式 ， 
首先 将 定律 右 式 中 的 变量 用 其 绑 定 的 表达 式 代 换 ， 然 后 用 代 换 后 的 右 式 代 和 奉子 表达 式 。 匹 
配 、 代 换 和 重 写 都 是 计算 右 的 基本 组 成 部 分 。 
现在 假定 使 用 以 上 同一 组 定律 化 简 表 达 式 map E . filter (p . f)。 下 面 是 计算 
过 程 : 
map f . filter (p . £) 
‘= {definition filter} 
map f . concat . map (box (p . f)) 
= {map after concat} 
concat . map (map f) . map (box (p . f)) 
= {map functor} 
concat . map (map f . box (p . f)) 
= {definition box} 
concat . map (map f . if (p . f) one nil) 
= {dot after if} 
concat . map (if (p . f) (map f . one) (map f . nil)) 
= {map after nil} 
concat . map (if (p . f) (map f . one) nil) 


= {map after one} 
concat . map (if (p . f) (one . f) nil) 


同样 ， 茶 些 定 律 有 可 能 按照 不 同 的 次 序 应 用 。 对 最 后 的 表达 式 没 有 可 用 的 定律 ， 所 以 
成 为 计算 的 结果 。 
这 里 要 说 明 的 重点 是 ， 两 个 计算 的 最 后 表达 式 是 一 样 的 ， 所 以 证 明了 


filter p . map f = map f . filter (P ，f) 


这 就 是 将 要 进行 的 等 式 证 明 的 方法 ,将 两 边 人 简化 为 同一 个 结论 。 代 之 以 将 两 个 计算 一 个 接 
一 个 显示 出 来 ， 男 一 种 方法 是 将 两 个 计算 结果 丫 在 一 起 ， 先 记录 第 一 个 计算 过 程 ， 然 后 附 
上 第 二 个 计算 的 道 过 程 。 这 种 方法 的 主要 优点 是 人 简单， 为 了 达到 期 望 的 目标 ， 不 必 发明 一 
种 新 的 证 明 形式 ， 也 不 一 定 要 按照 从 右 到 左 的 方式 使 用 定律 。 所 以 ， 我 们 还 将 定义 一 个 证 
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明 等 式 的 函数 : 


prove :: [Law]j -> Equation -> Calculation 


进一步 的 考虑 


计算 磊 的 一 个 基本 约束 是 定律 只 能 从 一 个 方向 应 用 ， 即 从 左 至 右 应 用 定律 。 这 个 约束 
主要 是 为 了 避免 计算 陷 人 循环 。 如 果 人 允许 在 两 个 方向 应 用 定律 ， 那 么 计算 器 可 能 在 一 个 方 
回应 用 一 个 定律 ， 然 后 立即 从 反方 向 应 用 该 定律 ， 从 而 来 回 摆动 。 

即使 规定 从 左 到 右 的 规则 ， 有 些 定律 仍然 可 能 导致 无 限 的 计算 。 典 型 的 情况 是 递归 函 
数 定义 的 定律 。 例 如 ， 考 虑 iterate 的 定义 : 


defn iterate: iterate f = cons . fork id (iterate f . f£) 


这 是 点 目 由 形式 的 iterate 定义 。 图 数 cons 和 fork 定义 如 下 : 


cons (X,XS) = XxX:xs 
fork fgx = (f x,g xX) 


在 第 4 章 和 第 6 章 的 习题 中 已 经 遇 到 过 fork， 只 是 那里 写成 fork (f£,g) 而 不 是 这 里 的 
fork f g。 以 下 的 定义 都 采用 卡 瑞 式 。 项 iterate f£ 在 定律 两 边 出 现 的 形式 表示 ， 如 果 


一 个 计算 可 以 使 用 iterate 的 定义 一 次 ， 那 也 意味 着 这 个 定义 可 以 潜在 地 被 使 用 无 限 次 。 
但 是 ， 这 种 事 也 不 是 必然 的 。 下 面 的 计算 (计算 右 生 成 的 ) 就 避免 了 无 穷 次 的 回归 : 


head . iterate f 
= {defn iterate} 
head . cons . fork id (iterate f . f) 


= {head after cons} 

fst . fork id (iterate f . f) 
= {fst after fork} 

id 


这 个 计算 使 用 了 下 面 两 个 定律 : 


head after cons: head . cons = fst 
fst after fork: fst . fork fg=£ 


这 个 计算 能 够 避免 无 穷 计 算 的 原因 是 这 两 个 定律 有 比 定义 高 的 优先 级 ， 后 面 将 会 进一步 说 
明 这 个 技巧 。 


为 了 说 明 计 算 器 的 能 力 ， 能 做 什么 ， 不 能 做 什么 ， 下 面 是 另 一 个 将 递归 定义 翻译 成 点 
自由 形式 的 例子 。 考 虑 串联 的 定义 : 


[] ++ ys = ys 
(X:XS) ++ ys = XxX:(xs ++ ys) 


下 面 将 用 cat 表示 ( ++ )。 男 外 还 需要 nil、cons 和 函数 cross (£f,g)， 并 用 
f *g 表 示 后 者 。 因 此 ， 有 


(f * g) (x,y) = (f x, g& y) 


最 后 ， 还 需要 一 个 组 合子 assocr (associate-right 的 简写 ) ， 其 定义 为 


assocr ((x,y) ,Zz) = (X,(y,Z)) 


下 面 是 cat 两 个 定义 方程 的 点 目 由 式 翻 译 ; 


cat . (nil * id) = snd 
cat . (cons * id) = cons . (id * cat) . assocr 


202 第 12 章 


不 能 用 这 里 的 计算 天 证 明 cat 满足 结合 律 ， 因 为 证 明 涉 及 归纳 证 明 , 但 是 ， 可 以 将 
其 陈述 为 一 个 定律 : 


cat associative: cat . (cat * id) = cat . (id * cat) . assocr 


继续 深入 这 个 例子 ， 下 面 是 (*) 的 两 个 双 函 和子 定 律 : 


bifunctor *: id * id = id 
bifunctor *: (人 
下 面 是 关于 assocz 的 定律 : 


assocr law: assocr . ((f * g) * h) = (f * (g * h)) . assocr 


对 于 这 个 例子 ， 计 算 器 不 能 完成 下 列 的 合法 计算 : 
cat . ((cat . (f * g)) * h) 
= {identity law, in backwards direction} 
cat . ((cat . (f * g)) * (id . bh)) 
= {bifunctor *, in backwards direction} 
cat . (cat * id) . ((f * g) * h) 
= {cat associative} 
cat . (id * cat) . assocr . ((f * g) * h) 
= {assoc law} 
cat . (id * cat) . (f * (g * h)) . assocr 
= {bifunctor *} 
cat . ((id . f) * (cat . (g * h))) . assocr 
= {identity law} 
cat . (f * (cat . (g * h))) . assocr 


问题 在 于 恒 等 律 和 双 隐 子 律 必须 在 两 个 方向 使 用 ,但 是 计算 此 不 能 完成 这 样 的 工作 。 
注意 到 证 明 的 本 质 在 于 下 列表 达 式 的 两 种 不 同人 简化 : 


cat . (id * cat) . assocr . ((f * g) * h) 


一 种 使 用 cat 的 结合 律 ， 其 表现 形式 为 


cat associative: cat . (id * cat) . assocr = cat . (cat * id) 


男 一 种 使 用 assocr 定律 。 即 使 推广 calculate 使 其 返回 所 有 可 能 计算 构成 的 树 ， 但 从 
哪个 表达 式 开 始 可 以 得 到 以 上 计算 仍然 不 是 明显 的 ， 所 以 禁止 了 计算 器 返回 一 棵 树 。 

不 只 是 图 子 律 有 时 需要 从 两 个 方向 使 用 ， 例 子 见 12. 8 节 。 这 个 问题 有 时 可 以 避免 ， 
比如 使 用 比 实际 要 求 更 通用 的 定律 ， 或 者 通过 分 析 ， 然 而 有 时 还 是 完全 不 能 避免 。 如 一 开 
始 所 讲 ， 计 算 需 能 力 是 有 限 的 。 

我 们 设计 的 自动 计算 只 有 两 个 自由 度 : 选择 应 用 的 定律 和 选择 化 简 的 子 表 达 式 。 第 一 
个 自由 度 可 以 包含 在 这 些 定 律 在 计算 器 中 排列 的 顺序 中 : 如 果 有 两 个 不 同 定律 可 应 用 ， 那 
么 选择 前 一 个 定律 。 

显然 有 些 定 律 应 该 在 另 一 些 定 律 之 前 应 用 ， 先 应 用 的 应 该 是 可 以 降低 中 间 表 达 式 复杂 
度 的 定律 。 很 好 的 例子 是 定律 E.ia =E 和 ia .ff =E。 复 杂 度 的 简单 定义 是 右边 的 复 
合 比 左边 的 少 。 这 些 定律 一 旦 有 机 会 就 使 用 不 会 有 错误 。 事 实 上 ，iq 是 复合 的 单位 元 ， 
而 且 将 被 写 进 计算 器 ， 这 样 两 个 单位 元 律 将 被 自动 应 用 。 类 似 地 ， 及 早 应 用 如 nil .ff = 
nil 和 map f.nil = nil 这 样 的 定律 (确实 是 iterate 计算 中 使 用 的 两 个 定律 ) 将 降 
低 复 合 次 数 ， 有 助 于 降低 中 间 表 达 式 的 规模 。 为 了 明确 起 见 ， 称 这 些 定 律 为 简单 定律 。 

另 一 方面 ， 某 些 定 律 只 是 到 最 后 才 使 用 。 典 型 的 是 定义 ， 如 filter 或 者 iterate 
的 定义 。 例 如 ， 在 下 列表 达 式 中 : 
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map f . concat . map (filter p) 


不 想 太 早 使 用 filter 的 定义 ; 而 且 在 concat 定律 后 先 使 用 map， 只 有 在 后 面 必要 的 时 
候 再 使 用 filtez 的 定义 。 不 说 别 的 ， 中 间 表 达 式 将 会 更 短 。 

综 上 所 述 ， 看 起 来 合理 的 方法 是 将 定律 按照 “简单 定律 、 非 简单 也 非 定义 的 定律 、 征 
义 ”的 顺序 应 用 。 

第 二 个 自由 度 用 给 定 表 达 式 中 子 表达 式 作为 定律 应 用 特例 的 顺序 表达 : 如 果 定 律 可 应 
用 于 两 个 不 同 的 表达 式 ， 那 么 先 选 列 在 前 面 的 子 表达 式 。 

现在 仍然 没有 决定 使 用 定律 和 子 表 达 式 的 优先 次 序 。 是 先 选 一 个 子 表达 式 ， 然 后 轮流 
检查 每 个 定律 是 否 可 用 于 该 子 表达 式 ， 还 是 先 选 一 个 定律 ， 然 后 检查 这 个 定律 可 用 于 哪个 
子 表达 式 ? 或 许 将 某 个 定律 应 用 于 一 个 表达 式 后 ， 下 一 个 利用 的 定律 很 可 能 是 “旁边 的 ” 
某 个 子 表达 式 ， 但 是 如 何 表达 这 种 附近 的 概念 不 是 很 清楚 ， 从 计算 时 间或 者 结果 的 长 度 上 
讲 ， 这 样 做 是 否 会 提高 计算 的 效率 也 不 清楚 。 


12. 2 表达 式 


计算 器 的 核心 是 表达 式 的 数据 类 型 Bxpr。 计 算 器 的 许多 配件 都 需要 通过 各 种 方式 分 
析 和 处 理 表达 式 。 表 达 式 是 由 ( 艺 数 ) 变量 和 常量 构成 的 ， 函 数 复合 运算 是 基本 的 组 合 形 
式 。 变 量 没 有 参数 ,但 是 常量 可 以 有 任意 多 参数 ， 这 些 参数 本 身 也 是 表达 式 。 假 定 所 有 也 
数 是 卡 瑞 式 的 ， 没 有 多 元 组 参数 ， 如 写 pair f g， 而 不 写 pair (£f,g)。 没 有 特别 的 理 
由 避免 使 用 多 元 组 ， 只 是 本 书 讨论 的 大 多 数 函 数 都 是 卡 瑞 式 的 ， 没 有 必要 两 种 形式 都 
使 用 。 

为 了 补偿 ， 人 允许 使 用 中 缀 二 元 运算 ， 如 写 E *g， 而 不 写 cross f g。 除 函数 复合 运 
算 外 ， 对 二 元 运算 的 优先 级 或 结合 性 不 做 任何 假设 ， 当 表达 式 包 含 这 些 运算 时 全 部 使 用 括 
号 。 这 里 仍然 没有 回答 的 问题 是 ，f *g . h 表示 (E *xg) .hh 还 是 Ex* (dg . h)? Haskell 
规定 函数 复合 具有 更 高 优先 级 ， 我 们 遵循 这 个 规则 。 所 以 ，f£ *g . Ph 被 视 为 f * (g . h)。 
但 是 ， 我们 会 永远 使 用 括号 以 避免 上 收 义 。 


下 面 是 表达 式 的 BNF 语法 : 

expr  ::= simple {op simple} 

simple ::= term {'.' term}* 

term ::= Var | con {arg}* | '(' expr ')'! 
arg := Var | con | '(' expr ')' 

var ::= letter {digit} 

con ::= letter letter {letter | digit}* 
op ::= {symbol}+ 


变量 名 由 单个 字母 表示 ， 也 可 以 后 接 一 位 数字 。 所 以 ，f 和 fl 都 是 合法 的 变量 名 。 常 量 
名 由 两 个 以 上 字母 数字 序列 构成 ， 用 两 个 字母 开始 ， 如 map 和 lhs2tex， 而 运算 名 用 非 
字母 数字 序列 表示 ， 如 * 和 <+>。 语 法 的 第 一 行 表 示 ， 一 个 表达 式 是 一 个 简单 表达 式 ， 
可 以 后 接 一 个 运算 符 和 另 一 个 简单 表达 式 。 简 单 表达 式 是 项 的 组 合 。 相 信 剩 余 的 行 是 容易 
理解 的 。 

下 面 是 要 使 用 的 Expr 的 定义 : 
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newtype Expr = Compose [Atom] deriving Eq 
data Atom = Var VarName | Con ConName [Expr] 


deriving Eq 
type VarName = String 
type ConName = String 


表达 式 和 原子 声明 为 类 族 Eq 的 成 员 ， 因 为 需要 测试 表达 式 是 否 相 等 。 稍 后 将 定义 Expr 
为 类 族 Show 的 实例 ， 以 便 将 表达 式 打印 在 终端 。 
以 下 是 一 些 表 达 式 及 其 表示 的 例子 : 


f .g.h => Compose [Var "f",Var "g" ,Var "h"] 


id => Compose [] 
fst => Compose [Con "fst" []] 
at => Compose [Con "fst" [] ,Var "f"] 


(f * g) . h => Compose [Con "*" [Compose [Var "f"],Compose [Var "g"]],Var "h"] 
f*g.h => Compose [Con "*" [Compose [Var "f"], 
Compose [Var "g",Var "h"]]] 


函数 复合 运算 满足 结合 律 的 性 质 已 经 定义 在 Expr 中 。 特 殊 的 常数 id 保留 ， 并 总 是 
解释 为 复合 的 单位 元 
前 前 面 描述 的 语法 分 析 组 合 运算 使 我 们 得 以 分 析 表 达 式 。 根 据 BNF 定义 ， 首 先 有 


expr :: Parser Expr 
expr = simple >>= rest 
where 
rest si = do {op <- operator; 
s2 <- simple; 
return (Compose [Con op [si,s2]])} 
<|> return s1 


一 个 运算 符 是 一 个 或 者 多 个 运算 符号 的 序列 ， 只 要 不 含 复合 运算 竺 和 等 号 : 


operator :: Parser String 
operator = do {op <- token (some (sat symbolic)); 
Parsing.guard (op /= "." && op /= "="); 


return op} 


symbolic = (“elem” opsymbols) 
opsymbols = "!@#$%h&*+./<=>?\\ |:—™" 
图 数 Parsing .guard 是 一 个 受 限 (qualified) 名 的 例子 。Haskell 的 引导 库 Prelude 
也 提供 了 一 个 名 为 guard 的 函数 ,但 是 这 里 需要 的 是 包含 所 有 语法 分 析 阴 数 的 模块 
Parsing 的 同名 函数 。 一 个 受 限 名 由 一 个 模块 名 后 接 一 个 句点 ， 再 后 接受 限 值 的 名 构成 。 
一 个 简单 表达 式 由 一 个 或 者 多 个 项 的 序列 构成 ， 项 之 间 用 复合 运算 符 分 隅 : 


simple :: Parser Expr 
simple = do {es <- somewith (Symbol ".") term; 
return (Compose (concatMap deCompose es))} 


函数 concatMap f 是 concat . map E 的 蔡 代 图 数 ， 由 标准 引导 库 提 供 ， 而 deCom- 
pose 如 下 定义 : 

deCompose :: Expr -> [Atom] 

deCompose (Compose as) = as 

接 下 来 ， 一 个 项 是 表示 变量 或 者 常量 的 标识 符 ， 常 量 可 以 带 参数 ， 或 者 是 加 括号 的 表 
达 式 : 
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term :: Parser Expr 
term = ident args <|> paren expr 
args = many (ident none <|> paren expr) 


分 析 此 ident 输入 一 个 表达 式 列 表 的 分 析 右 ， 返回 表达 式 的 一 个 分 析 带 : 


ident :: Parser [Expr] -> Parser Expr 

ident args 

= do {x <- token (some (sat isAlphaNum)); 
Parsing.guard (isAlpha (head x)); 
if isVar x 
then return (Compose [Var x]) 


else if (x == "id") 
then return (Compose []) 
else 


do {as <- args; 
return (Compose [Con x as])}} 


测试 是 否 合理 变量 的 函数 如 下 定义 : 


isVar [x] = True 
isVar [x,d] = isDigit d 
isVar _ = False 


注意 ， 任 何 完全 由 字母 数字 组 成 ， 而 且 由 字母 开始 又 不 是 变量 的 标识 符 是 常量 。 
接 下 来 将 Expr 和 Atom 定义 成 Show 的 实例 。 如 前 所 述 ， 我们 将 通过 给 每 个 类 型 定 
义 函 数 showsPrec p 来 完成 。 稍 加 思考 便 可 发 现 ，p 需要 3 个 值 : 
e 顶层 无 需 插 号 。 例 如 ， 所 有 这 些 式 子 map f . map g,foo *baz 和 bar bie 
doll 虱 不 宕 要 括号 。 将 p =0 赋予 这 种 情况 。 
。 当 一 个 表达 式 是 项 的 复合 ， 或 者 运算 符 表 达 式 ， 并 且 是 一 个 常量 的 参数 时 ， 需 要 
将 表达 式 括 起 来 。 例 如 ， 在 下 列表 达 式 中 需要 括号 : 


map (f . g) . foo f g . (bar * bar) 


但 是 ， 中 间 项 无 需 括号 。 将 p =1 赋予 这 种 情况 。 
。 最 后 ，p =2 表示 应 该 给 项 的 复合 加 括号 ， 给 运算 符 表达 式 以 及 至 少 有 一 个 参数 的 
卡 天 函数 加 括号 。 例 如 : 


map (f . g) . foo (foldr f e) g . (bar * bar) 


下 面 给 出 实例 定义 。 先 定义 : 


instance Show Expr where 

showsPrec p (Compose []) = ShowString "id" 
showsPrec P (Compose [a]j) = showsPrec p a 
showsPrec p (Compose as) 

= showParen (p>0) (showSep " . " (showsPrec 1) as) 


最 后 一 行使 用 了 如 下 定义 的 函数 showSep: 


ShowSep :: String -> (a -> ShowS) -> [a] -> ShowS 
showSep sep £f 
= Compose . intersperse (showString sep) . map f 


工具 函数 Compose 定义 为 Compose = foldr (.) ids 困 数 lntersperse :: 
a -> [al -> [a] 可 以 在 Data.List 中 找到 ， 用 于 将 第 一 个 参数 插入 到 第 二 个 参数 元 素 
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之 间 。 例 如 : 


intersperse ',' "abcde" == "a,b,c,d,e" 


showsPrec 的 后 两 个 子 句 中 右边 showsPrec 的 两 次 出 现 表示 原子 上 的 相应 函数 : 


instance Show Atom where 

showsPrec p (Var v) = showString V 
showsPrec p (Con f []) = showString 工 
showsPrec p (Con f [el,e2]) 


| isOp f = showParen (p>0) (showsPrec 1 el . showSpace . 
showString f . showSpace . showsPrec 1 e2) 
showsPrec p (Con f es) 
= showParen (p>1) (ShowString f . showSpace . 
showSep " " (showsPrec 2) es) 


isOp f = all symbolic f 


p =2 在 最 后 一 个 子 句 中 用 到 ， 因 为 我 们 想 在 如 foo (bar bie) doll 中 加 括号 。 变 
量 和 和 零 元 向 量 无 需 括号 。 


一 个 模块 结构 


最 后 一 步 是 将 这 些 定义 ， 或 许 还 有 另外 的 定义 ， 放 置 在 一 个 模块 中 。 这 个 模块 将 包含 
所 有 与 表达 式 有 关 的 函数 。 

构建 这 样 的 模块 还 不 能 马上 完成 ， 因 为 不 清楚 在 其 他 模块 (如 处 理 定 律 和 计算 等 模 
块 ) 中 ， 可 能 需要 表达 式 的 男 外 哪些 也 数 。 但 是 ， 目 前 可 以 如 下 声明 : 


module Expressions 
(Expr (Compose), Atom (Var ,Con) ， 
VarName, ConName, deCompose, expr) 
ns Parsing 
import Data.List (intersperse) 
import Utilities (compose) 
import Data.Char (isAlphaNum,isAlpha,isDigit) 
模块 Expressions 必须 存储 在 文件 Expressions .lhs 中 ,使 得 Haskell 可 以 找到 
这 个 模块 的 位 置 。 该 模块 输出 类 型 Expr 和 Atom 以 及 它们 的 构造 图 数 ， 还 输出 类 型 同 义 
词 varName 和 ConName， 以 及 函数 deCompose 和 expr， 所 有 这 些 都 可 能 在 处 理 定律 
的 模块 中 用 到 。 稍 后 可 能 在 输出 列表 中 添加 更 多 的 因数 。 
接 下 来 是 输入 。 我 们 输入 了 语法 分 析 函 数 的 模块 Parsing, 以 及 模块 Data .List 
和 Data .char 中 的 一 些 图 数 。 我 们 还 将 设置 一 个 模块 Utilities， 放置 通用 工具 函数 。 
一 个 好 的 工具 函数 例子 是 上 面 定 义 的 compose， 这 个 函数 不 是 特定 于 表达 式 的 ， 可 能 在 
其 他 地 方 用 到 ， 所 以 将 其 放 在 工具 模块 中 。 


12.3 定律 
用 下 列 方法 定义 定律 : 
data Law = Law LawName Equation 


type LawName = String 
type Equation = (Expr ,Expr) 


一 个 定律 由 一 个 描述 名 和 一 个 等 式 构 成 。 分 析 定 律 的 分 析 吉 定 义 为 
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law :: Parser Law 

law = do {name <- upto ':'; 
eqn <- equation,; 
return (Law name eqn)} 


语法 分 析 图 数 upto c 返回 直到 c 但 不 包含 c 的 串 ， 然 后 丢弃 c， 如 果 找 到 c 的 话 。 
该 函数 不 含 在 第 11 章 的 分 析 带 哨 数 中 ,但 是 为 了 不 破坏 分 析 带 的 抽象 性 ， 将 其 置 于 模块 
Parsing 之 中 。 一 种 定义 方法 是 


upto :: Char -> Parser String 

upto c 

= Parser (\s -> 
let (xs,ys) = break (==c) s in 
if null ys then [] 
else [(xs,tail ys)]) 


分 析 般 equation 定义 如 下 : 
equation :: Parser Equation 
equation = do {ei <- expr; 
symbol "="; 
e2 <- expr; 


return (ei1,e2)} 


或 许 不 需要 显示 定律 ， 不 过 下 面 是 其 定义 : 


instance Show Law Where 
showsPrec _ (Law name (el,e2)) 


= ShowString name . 
ShowStTring ": ” . 
ShowS el . 
ShowString "= ". 
ShowS e2 


优先 级 数 在 showsPrec 的 定义 中 不 需要 ， 故 使 用 了 不 在 意 模 式 。 回 顾 shows 的 输 
人 是 一 个 可 打印 值 ， 在 这 里 是 一 个 表达 式 ， 然 后 返回 一 个 类 型 shows 的 函数 ， 即 类 型 
String -> String 的 同义词 。 

最 后 对 定律 排序 : 


sortLaws :: [Law] -> [Law] 
sortLaws laws = simple ++ others ++ defns 


where 
(simple,nonsimple) = partition isSimple laws 
(defns ,others) = partition isDefn nonsimple 


这 个 定义 利用 Data .List 的 列表 划分 限 数 partition: 


partition p xs = (filter p xs, filter (not . p) xs) 


isSimple (Law _ (Compose asl,Compose as2)) 
= length asl > length as2 

isDefn (Law _ (Compose [Con f es]，_)) 
= all isVar es 

isDefn _ = False 

isVar (Compose [Var _]) = True 

isVar _ False 
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测试 isvar 也 出 现在 模块 Expressions 中 , 但 是 定义 不 同 。 不 过 这 不 是 问题 ， 因 
为 该 图 数 没 有 从 表达 式 模 块 输出 。 
下 面 是 定律 模块 的 声明 : 
module Laws 
(Law (Law), LawName, law, sortLaws, 
Equation, equation) 
where 
import Expressions 
import Parsing 
Sl import Data.List (partition) 


完成 如 何 分析 和 打印 表达 式 及 定律 后 ， 现 在 可 以 定义 两 个 因数 ， 一 个 是 calculate 
的 一 个 版 本 ,但 是 它 不 消耗 定律 和 表达 式 ， 而 是 消耗 串 : 


simplify :: [String] -> String -> Calculation 
simplify strings string 
= let laws = map (parse law) strings 
e = parse expr string 
in calculate laws e 


类 似 地 ， 可 定义 : 


prove :: [String] -> String -> Calculation 
prove strings string 
= let laws = map (parse law) strings 
(el,e2) = parse equation string 
in paste (calculate laws el) (calculate laws e2) 


这 两 个 函数 可 以 放置 在 模块 Main 中 。 将 paste 和 calculate 放置 在 只 与 计算 相关 的 
模块 中 ， 这 是 12.4 节 的 内 容 。 


12.4 计算 
计算 的 定义 如 下 : 


data Calculation = Calc Expr [Step] 
type Step = (LawName ,Expr) 


和 匈 从 计算 需 的 关键 定义 开始 ， 即 calculate 的 定义 : 


calculate :: [Law] -> Expr -> Calculation 
calculate laws 6e = Calc e (manyStep rws e) 
where rws e = [(name,e') 
| Law name eqn <- sortedlaws, 
e' <- rewrites eqn e， 
e' /= e] 
sortedlaws = sortLaws laws 
图 数 rewrite :: Equation -> Expr -> [Expr] 返 回 使 用 一 个 等 式 重 写 一 个 表达 
式 的 所 有 可 能 结果 的 列表 ， 该 函数 将 在 男 一 个 模块 定义 。 一 个 表达 式 可 能 被 重 写 为 表达 式 本 
里 ( 见 习题 HH), 但 是 这 样 的 可 能 导致 无 穷 计算 的 重 写 是 不 允许 的 。 函 数 rws :: Expr -> 
[Step] 返 回 以 所 有 可 能 方式 使 用 定律 得 到 新 表达 式 的 单 步 计算 列表 ,该 列表 通过 轮流 使 用 
定律 生成 所 有 可 能 结果 得 到 。 这 表示 在 计算 中 ， 定 律 的 应 用 优先 于 子 表达 式 ， 由 此 也 解决 了 
12. 1 区 提出 的 担心 的 问题 。 只 有 实验 能 证 明 我 们 的 选择 是 否 正确 。 
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图 数 manyStep 使 用 rws 构建 尽 可 能 多 的 步骤 : 


manyStep :: (Expr -> [Step]) -> Expr -> [Step] 
manyStep rws e 
= if null steps then [] 
else step : manyStep rws (snd step) 
Where steps = TWS ee 
step = head steps 


当 rsw e 是 空 列表 时 ， 计 算 结 束 ; 否则 ， 列 表 的 第 一 个 元 素 用 于 继续 计算 。 
计算 模块 的 其 他 函数 处 理 显 示 和 粘贴 计算 。 一 个 计算 的 显示 如 下 定义 : 


instance Show Calculation where 
showsPrec _ (Calc e steps) 
= showString "\n ". 
shows e . 
showChar '\n' . 
compose (map showStep steps) 


每 个 步骤 显示 如 下 : 


showStep :: Step -> ShowS 

showStep (why,e) 

= ShowString "= {". 
ShowString why . 
showString "}\n ". 


-Ch 
为 了 把 两 个 计算 粘贴 在 一 起 ， 必 须 将 一 个 计算 的 步骤 取 逆 。 例 如 ， 计 算 : 
Calc e0 [(whyl,el), (why2,e2), (why3,e3)] 
被 转换 成 


Calc e3 [(why3,e2), (why2,e1), (whyl,e0)] 


特别 是 ， 一 个 计算 的 结论 是 取 逆 后 的 第 一 个 表达 式 。 下 面 表示 如 何 将 一 个 计算 取 逆 : 


reverseCalc :: Calculation -> Calculation 
reverseCalc (Calc e steps) 
= foldl shunt (Calc e []) steps 
Where shunt (Calc el steps) (why,e2) 
= Calc e2 ((why,el) :steps) 


为 了 粘贴 两 个 计算 ， 首先 检查 两 个 计算 的 结论 是 否 相 同 。 如 果 不 相 同 ， 则 继续 烙 巾 两 
个 计算 ， 并 附 囊 一 个 失败 的 标示 : 


concl 


他 | 种 着 入 忆 | 志 


如 果 两 个 结论 相同 ， 还 可 以 做 得 更 聪明 一 点 ， 而 不 是 仅仅 将 两 个 计算 粘 在 一 起 。 如 采 一 个 
计算 的 倒数 第 二 个 结论 与 男 一 个 计算 的 倒数 第 二 个 结论 匹配 ， 那 么 可 以 将 最 后 一 步 剪 挥 。 
下 面 是 如 何 粘贴 两 个 计算 : 
paste :: Calculation -> Calculation -> Calculation 
paste calcl@(Calc el steps1) calc2 
= if concl == conc2 


then Calc el (prune concl rstepsl rsteps2) 
else Calc el (stepsl ++ (gap,conc2) :Tsteps2) 
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Where Calc concl rstepsi = reverseCalc calci 
Calc conc2 rsteps2 = reverseCalc calc2 


冰 数 prune 定义 如 下 : 


prune :: Expr -> [Step] -> [Step] -> [Step] 
Prune e ((_,el):stepsl) ((_,e2) :steps2) 
| el==e2 = prune el stepsl steps2 
prune e stepsl steps2 = rsteps ++ steps2 
Where Calc _ rsteps = reverseCalc (Calc e steps1) 


最 后 是 模块 Calculations 的 声明 : 


module Calculations 
(Calculation (Calc), Step, calculate, paste) 


where 

import Expressions 

import Laws 

import Rewrites 

import Utilities (compose) 


模块 输出 了 在 主 模块 中 定义 simplify 和 prove 需要 的 那些 类 型 和 函数 。 


12.5 重 写 


模块 Rewrites 的 唯一 目的 是 提供 困 数 rewrites 的 定义 ， 该 函数 出 现在 calculate 
定义 中 。 回 顾 表 达 式 rewrites eqn e， 它 返回 所 有 这 些 表达 式 的 列表 : 将 e 中 与 ean 的 
左 表 达 式 匹配 的 某 个 子 表 达 式 用 eqn 的 右 表 达 式 的 适当 特例 替换 。 

有 趣 的 是 找 出 rewrites 的 定义 。 假 如 构造 了 一 个 表达 式 的 所 有 子 表 达 式 的 列表 ， 
可 以 用 给 定 等 式 与 列表 的 每 个 元 素 匹 配 ， 计 算出 构成 匹配 的 替换 (可 能 没有 ， 也 可 能 有 一 
个 或 者 多 个 ， 见 12. 6 节 关 于 匹配 的 内 容 ) ， 然 后 计算 出 代 换 后 的 新 表达 式 。 但 是 ， 如 何在 
原 表 达 式 中 用 一 个 新 的 表达 式 代 换 一 个 子 表 达 式 ? 简单 的 回答 是 ， 没 有 办 法 ， 至 少 在 没有 
确定 每 个 子 表 达 式 在 原 表 达 式 中 的 上 下 文 或 者 位 置 之 前 是 不 可 行 的 。 若 能 确定 子 表 达 式 的 
位 置 ， 则 可 将 新 子 表 达 式 插 人 这 个 位 置 。 

方法 不 是 显 式 地 引入 上 下 文 ， 而 是 采取 另 一 种 途径 。 想 法 是 钻 进 一 个 表达 式 中 ， 在 某 
个 时 刻 对 某 个 表达 式 应 用 重 写 ， 然 后 在 爬 出 洞 时 构建 重 写 的 表达 式 。 将 需要 一 个 工具 函数 
anyone， 其 输入 是 能 够 生成 一 系列 选择 的 图 数 ， 以 及 一 个 列表 ， 然 后 为 列表 中 一 个 元 素 
设置 一 种 选择 。 其 定义 如 下 : 

anyDne :: (a -> [a]) -> [a] -> [[al] 

er 

anyDne f (x:xs) = [x':xs | x' <- f x] ++ 

[x:xs' | xs' <- anyOne f xs] 

或 者 为 列表 的 第 一 个 元 素 设 置 了 一 个 选择 ， 或 者 为 第 二 个 元 素 设 置 了 一 个 选择 ， 但 不 会 为 
两 个 元 素 同 时 设置 选择 。 例 如 ， 如 果 f1=[ -1,-2] 和 f2=[-3,-4]， 则 有 


anyDne 二 [1 ,2] , Lt 2 ,2.2 Ls=3, Lt, = 


以 下 是 rewrites 的 定义 : 
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rewrites :: Equation -> Expr -> [Expr] 
rewrites eqn (Compose as) = map Compose ( 
rewritesSeg eqn as ++ any0ne (rewritesA eqn) as) 
rewritesA eqn (Var v) = [] 
rewritesA eqn (Con k es) 
= map (Con k) (any0ne (rewrites eqn) es) 


定义 的 第 一 行 表 示 ， 将 当前 表达 式 一 段 (segment) 的 重 写 与 任意 适当 子 表 达 式 的 重 
写 串 联 。 只 有 有 参数 的 常数 有 子 表达 式 。 注 意 ，anyone 的 两 个 应 用 具有 不 同 的 类 型 ， 一 
个 应 用 于 原子 列表 ， 一 个 应 用 于 表达 式 列 表 。 

接 下 来 定义 rewritesSeg: 


rewritesSeg :: Equation -> [Atom] -> [[Atom]] 
rewritesSeg (el,e2) as 
= [asl ++ deCompose (apply sub e2) ++ as3 
| (asl,as2,as3) <- segments as, 
sub <- match (el,Compose as2)] 


图 数 segmants 将 列表 化 分 成 段 : 


segments as = [(asl,as2,as3) 
| (asi,bs) <- splits as， 
(as2,as3) <- splits bs] 


工具 函数 splits 用 各 种 可 能 方法 拆 分 一 个 列表 : 


splits :: [a] -> [([al, [al)] 
splits [] = [([];[L}] 
splits (a:as) = [([] ,a:as)] ++ 
[(a:asi,as2) | (asl,as2) <- splits as] 


例如 : 
ghci> splits "abc" 
Ce" "abc'") ("a" npce") ("ab' new) . ("abc" 3 9 ")] 
剩 下 的 函数 appl1y 和 match 具有 下 列 类 型 . 
apply :: Subst -> Expr -> Expr 
match :: (Expr,Expr) -> [Subst] 
这 两 个 图 数 分 别 定 义 在 它们 的 模块 Substitutions 和 Matchings 中 。 最 后 是 Rewrites 
的 模块 声明 : 


module Rewrites (rewrites) 

where 

import Expressions 

import Laws (Equation) 

import Matchings (match) 

import Substitutions (apply) 

import Utilities (anyOne, segments) 


12.6 匹配 


模块 Mat ching 的 唯一 目的 是 定义 函数 match。 该 函数 输入 两 个 表达 式 ， 返 回 一 个 
代 换 列表 ， 在 这 些 代 换 下 第 一 个 表达 式 可 以 转换 为 第 二 个 表达 式 。 如 果 两 个 表达 式 不 匹 
配 ， 则 匹配 不 生成 代 换 ， 但是， 如 果 匹 配 成 功 ， 则 可 能 生成 多 个 代 换 。 考 虑 匹配 表达 式 
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foo (f . g) 与 fo0o (a . b . c)。 将 f£ 绑 定 下 列 4 个 表达 式 中 任何 一 个 ,将 g 绑 定 相应 
的 男 一 个 ， 都 可 以 使 以 上 两 个 表达 式 匹 配 成 功 : 


id a, a 去 -六 5 有 


尽管 计算 需 每 一 步 选 择 一 个 代 换 ， 但 是 在 得 到 合法 匹配 过 程 中 考虑 多 种 代 换 很 重要 。 例 如 ， 
在 距 配 fog (EF 。 可 ) . bar gf6s5 (a .五 .区 . bar CG 时 , 子 表 达 式 f ,本 bB. 
c 匹配 ， 给 出 4 种 可 能 的 代 换 。 只 有 当 bar g 与 bar c 匹配 时 ， 其 中 的 3 个 代 换 被 拒绝 。 
过 早 对 第 一 次 匹配 的 单个 代 换 的 承 诡 有 可 能 导致 错失 一 个 成 功 匹 配 。 

最 直接 定义 match (el ,e2 ) 的 方法 是 将 el 原子 和 e2 原子 的 划分 并 排 排 列 ， 第 一 个 
原子 对 应 第 一 个 划分 段 ， 第 二 个 原子 对 应 第 二 个 划分 段 ， 等 等 。 图 数 alignments 具有 
下 列 类 型 : 

alignments :: (Expr,Expr) -> [[(Atom,Expr)]] 


并 完成 这 种 排列 对 应 。 定 义 这 个 函数 需要 将 一 个 列表 划分 为 给 定 段 数 的 函数 parts: 


parts :: Int -> [al -> [[[a]]] 
parts 0 [] = [[]] 
parts 0 as = [] 
parts n as = [bs:bss 
| (bs,cs) <- splits as, 
bss <- parts (n-1) cs] 


有 趣 的 是 前 两 个 子 句 : 将 空 列表 划分 为 0 段 有 一 种 划分 ， 即 空 划分 ， 但 是 将 非 空 列表 划分 
为 0 段 的 划分 不 存在 。 例 如， 


ghci> parts 3 "ab" 


[LY 村 ; ni 。 nab"] [L* 村 3 an ba] [™ ii nab" 5 i .| 
[*a” . i : wpb] a [an Hp" 5 林 *] 和 ["ab" 。 nl 全 “]] 
现在 可 以 定义 : 


alignments (Compose as,Compose bs) 
= [zip as (map Compose bss) | bss <- parts n bs] 
where n = length as 


将 每 个 原子 和 一 个 子 表达 式 配 对 后 ， 可 以 定义 原子 与 表达 式 的 匹配 mat cha: 


matchA :: (Atom,Expr) -> [Subst] 
matchA (Var v,e) = [unitSub v el] 
matchA (Con ki1 esl,Compose [Con k2 es2]) 
| k1==k2 = combine (map match (zip esl es2)) 
matchA _ = [] 


匹配 变量 永远 成 功 ， 并 给 出 单个 代 换 。 匹 配 两 个 常量 时 ， 只 有 常量 名 相同 时 匹配 才 成 功 。 
对 于 其 他 情况 ，matcha 返回 代 换 空 列表 。 函 数 matcha 依赖 于 match， 该 图 数 现 在 可 以 
定义 如 下 : 

match :: (Expr,Expr) -> [Subst] 

match = concatMap (combine . map matchA) . alignments 

最 后 的 配件 是 函数 combine :: [[Subst]] -> [Subst]。combine 的 参数 中 每 
个 代 换 列表 代表 可 能 的 选择 ， 所 以 combine 必须 用 所 有 可 能 的 方法 在 每 个 代 换 列表 中 选 
择 一 个 代 换 ， 然 后 进行 归 一 运算 得 到 结果 。 下 面 将 在 代 换 模块 中 讨论 这 个 函数 。 这 样 便 完 
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成 了 matches 的 定义 。 模 块 的 声明 如 下 : 


module Matchings (match) 

where 

import Expressions 

import Substitutions (Subst, unitSub, combine) 
import Utilities (parts) 


陋 数 parts 被 放 在 工具 模块 中 ， 因 为 它 不 是 特定 于 表达 式 的 。 


12.7 ” 代 换 
一 个 代 换 是 变量 到 表达 式 的 有 穷 映 射 。 关 联 列表 是 代 换 的 一 个 简单 表示 : 


type Subst = [(VarName ,Expr)] 


空 代 换 和 单个 代 换 定义 为 : 
emptySub = 日 
unitSub ve = [(v,e)] 
将 一 个 代 换 应 用 于 一 个 表达 式 可 以 得 到 男 一 个 表达 式 : 
apply :: Subst -> Expr -> Expr 
apply sub (Compose as) 
= Compose (concatMap (applyA sub) as) 


applyA sub (Var v) = deCompose (binding sub v) 
applyA sub (Con k es) = [Con k (map (apply sub) es)] 


子 数 pinding 在 一 个 非 空 代 换 中 查找 一 个 变量 的 绑 定 值 : 

binding :: Subst -> VarName -> Expr 

binding sub v = fromJust (lookup v sub) 

子 数 1ookup 在 Haskell 引导 库 Prelude 中 定义 ， 如 果 没 有 绑 定 值 ， 则 返回 Nothing， 
如 果 的 绑 定 值 是 es， 则 返回 Just e。 限 数 fromJust 在 库 Data .Maybe 中 定义 ， 其 功能 
是 去 掉包 装 Just。 

接 下 来 解决 combine。 该 函数 必须 用 所 有 可 能 的 方法 组 合 选 择 代 换 ; 在 每 个 组 成 列 
表 中 选择 一 个 代 换 ， 然 后 对 这 样 的 代 换 列表 进行 合 一 : 


combine = concatMap unifyAll . cp 


工具 函数 cp 已 经 见 过 多 次 ， 它 计算 一 个 列表 的 列表 的 笛 卡 儿 积 。 

函数 unifyAll 将 一 个 代 换 列表 合 一 。 为 定义 这 个 函数 ， 首 先 看 如 何 将 两 个 代 换 合 
一 。 如 果 两 个 代 换 相 容 ， 则 合 一 结果 是 两 个 代 换 的 并 ; 如 果 两 个 代 换 不 相 容 ， 则 合 一 结 采 
失败 。 为 了 处 理 失败 的 情况 ， 可 以 使 用 Maybe 类 型 ， 或 者 简单 地 用 空 列表 或 单元 素 列 表 。 
选择 后 者 ， 只 是 因为 12. 8 市 将 给 出 计算 右 的 男 一 个 定义 ， 最 简单 的 方法 是 统一 使 用 基于 
列表 的 函数 : 

unify :: Subst -> Subst -> [Subst] 

unify subl sub2 = if compatible subli sub2 


then [union subi sub2] 
else [] 


为 定义 compatible 和 union, 假定 代 换 按照 变量 名 的 字典 序 表示 。 如 果 两 个 代 换 
用 同一 个 变量 名 与 不 同 的 表达 式 关 联 ， 则 它们 是 不 相 容 的 : 


214 第 12 章 


compatible [] sub2 = True 

compatible subl [] = True 

compatible subi@((vi,e1):subli') sub2@((v2,e2):sub2') 
| vi<v2 = compatible subl' sub2 
| vi==v2 = if el==e2 then compatible Subl' sub2' 


else False 
| v1i>v2 = compatible subl sub2， 
并 运算 用 同样 的 方式 定义 : 


union [] sub2 = sub2 

union Subl [] = subl 

union subi@((vi,e1i):subl') sub26@((v2,e2) :sub2 ') 
| vi<v2 = (vi,ei):union subi' sub2 
| vi==v2 = (v1i,e1):union subl' sub2' 
| vi>v2 = (v2,e2) :union Subl sub2' 


冰 数 unifyAll 返回 一 个 空 列表 或 者 单元 素 列 表 : 


unifyAll :: [Subst] -> [Subst] 
unifyAll = foldr f [emptySub] 
where f sub subs = concatMap (unify sub) subs 


320 | 现在 已 经 完成 了 所 需要 的 所 有 定义 。 下 面 是 模块 声明 : 


module Substitutions 
(Subst, unitSub, combine, apply) 
where 
import Expressions 
import Utilities (cp) 
import Data.Maybe (fromJust) 


这 样 ， 计 算 需 总 共 由 9 个 模块 构成 。 


12.8 测试 计算 器 


计算 天 的 实用 性 如 何 呢 ? 回答 这 个 问题 的 唯一 方法 是 在 一 些 例 子 上 试用 计算 右 。 这 里 
将 展示 两 个 计算 例子 。 第 一 个 是 第 5 章 做 过 的 关于 数 独 中 选择 矩阵 裁剪 的 计算 。 实 际 上 是 
想 证 明 : 


filter (all nodups . boxs) . expand . pruneBy boxs 
= filter (all nodups . boxs) . expand 


可 以 使 用 的 定律 如 下 : 


defn pruneBy: pruneBy f = f . map pruneRow . f 
expand after boxs: expand . boxs = map boxs . expand 
filter with boxs: filter (p . boxs) 

= map boxs . filter p . map boxs 


boxs involution: boxs . boxs = id 

map functor: map 了 . map g = map (f.g) 

map functor: map id = id 

defn expand: expand = cp . map cp 

filter after cp: filter (all p) . cp = cp . map (filter p) 
law of pruneRow: filter nodups . cp . pruneRow 


= filter nodups . cp 


下 面 的 计算 完全 是 由 计算 占 完 成 的 ， 只 是 为 了 显示 的 方便 ， 把 菜 些 表达 式 写 成 两 个 ， 
这 个 任务 应 该 由 精美 打印 工具 完成 。 无 需 研究 细节 ， 只 要 注意 接近 结尾 的 计算 : 


filter (all nodups . boxs) . expand . pruneBy boxs 
= {filter with boxs} 
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map boxs . filter (all nodups) . map boxs . expand . 
pruneBy boxs 
= {defn pruneBy} 
map boxs . filter (all nodups) . map boxs . expand . 
boxs . map pruneRow . boxs 
{expand after boxs} 


map boxs . filter (all nodups) . map boxs . map boxs . 
expand . map pruneRow . boxs 

{map functor} 
map boxs . filter (all nodups) . map (boxs . boxs) . expand . 
map pruneRow . boxs 

{boxs involution} 
map boxs . filter (all nodups) . map id . expand . 
map pruneRow . boxs 
= {map functor} 

map boxs . filter (all nodups) . expand . map pruneRow . boxs 
= {defn expand} 

map boxs . filter (all nodups) . cp . map cp . map PruneRow . boxs 
= {map functor} 

map boxs . filter (all nodups) . cp . map (cp . pruneRow) . boxs 
= {filter after cp} 

map boxs . cp . map (filter nodups) . map (cp . pruneRow) . boxs 
= {map functor} 
map boxs . cp . map (filter nodups . cp . pruneRow) . boxs 

{law of pruneRow} 
map boxs . cp . map (filter nodups . cp) . boxs 

} 


map boxs . filter (all nodups) . map boxs . cp . map cp 
= {defn expand} 

map boxs . filter (all nodups) . map boxs . expand 
= {filter with boxs} 

filter (all nodups . boxs) . expand 


是 的 ,计算 失败 了 。 原 因 不 难看 出 ， 需 要 在 两 个 方向 使 用 下 列 定律 : 


expand after boxs: expand . boxs = map boxs . expand 


但 是 ， 计 算 融 做 不 到 。 
解决 方法 是 进行 人 工分 析 ， 添 加 一 个 额外 的 定律 : 


hack: map boxs . cp . map cp = cp . map cp . boxs 
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这 个 定律 正 是 左右 调换 的 expand after boxes 定律 ， 其 中 expand 替换 成 了 定义 。 这 


样 一 来 计算 融 非 常 满意， 生成 了 预期 的 绪论: 


map boxs . cp . map (filter nodups . cp) . boxs 
= {map functor} 
map boxs . cp . map (filter nodups) . map cp . boxs 
= {filter after cp} 
map boxs . filter (all nodups) . cp . map cp . boxs 
= {hack} 
map boxs . filter (all nodups) . map boxs . cp . map cp 
= {defn expand} 
map boxs . filter (all nodups) . map boxs . expand 


{filter with boxs} 
filter (all nodups . boxs) . expand 


两 种 情况 的 计算 都 在 几 分 之 一 秒 内 完成 ， 所 以 效率 似乎 不 是 问题 。 除 了 那个 人 工分 析 


以 外 ， 计 算 符合 要 求 ， 几 乎 可 以 达到 一 个 好 的 人 工 计算 紫 的 能 力 。 
改进 计算 尼 


第 二 个 例子 更 是 雄心 勃勃 : 使 用 计算 器 导出 计算 亏 的 羽 一 个 版 本 。 再 次 细 看 mat ch 
的 定义 ， 定 义 依 赖 于 combine， 后 者 涉及 复杂 的 两 个 代 换 的 合 一 ， 附 带 配 套 的 相 容 性 测 
试 和 并 的 计算 。 一 个 更 好 的 想法 是 ， 只 有 当 两 个 代 换 中 有 一 个 是 单位 代 换 时 才 计 算 两 个 代 
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换 的 并 。 然 后 一 切 变 得 更 简单 ， 或 者 更 快 。 什 么 技术 可 以 描述 这 种 优化 呢 ? 是 的 ， 这 是 态 
一 个 累积 参数 的 例子 。 就 像 累积 参数 可 以 避免 使 用 昂贵 的 运算 ++ 一样 ， 在 此 希望 避免 使 
用 昂贵 的 运算 uni fy。 
首先 ， 下 面 是 match 的 定义 ， 使 用 了 几 个 新 的 辅助 图 数 : 


match = concatMap matchesA . alignments 

matchesA = combine . map matchA 

matchA (Var v,e) = [unitSub v e] 

matchA (Con kl esl,Compose [Con k2 es2]) 
| k1i==k2 = matches (zip esl es2) 

matchA _ = [] 

matches = combine . map match 


注意 ， 这 些 函 数 的 依赖 关系 呈 环 形 : 
match -~--> matchesA --> matchA --> matches --> match 


这 4 个 函数 推广 如 下 : 


xmatch sub = concatMap (unify sub) . match 
xmatchA sub = concatMap (unify sub) . matchA 
xmatches sub = concatMap (unify sub) . matches 
xmatchesA sub = concatMap (unify sub) . matchesA 


每 个 函数 中 新 加 的 参数 是 一 个 累积 参数 。 目 的 是 找到 这 些 函 数 的 新 定义 ， 其 环 状 依赖 关系 
同 前 。 

对 于 第 一 个 计算 ,希望 用 xmatch 重 写 match， 由 此 建立 两 组 定义 间 的 联系 。 为 方 
省 笔墨 ， 将 concatMap 简 记 作 cmap。 需 要 的 3 个 定律 是 


defn xmatch: xmatch s = cmap (unify s) . match 
unify of empty: Wnify emptySub = one 
cmap of one: cmap one = id 


在 第 一 个 定律 中 必须 写 s 而 不 写 sub (为 什么 ?); 第 二 个 定律 是 下 列 事实 的 点 目 由 
版 本 : 


unify emptySub sub = [sub] 
cmap one xs = concat [[x] | x <- xs] = XS 


计算 各 不 费力 气 便 给 出 : 


xmatch emptySub 
= {defn xmatch} 

cmap (unify emptySub) . match 
= {unify of empty} 

cmap one . match 
= {cmap of one} 

match 


下 面 再 来 处 理 xmatchA。 由 于 matchA 定义 中 笨拙 的 模式 匹配 方式 ， 因 此 仅仅 给 出 
一 个 简单 的 (人工 ) 计算 结果 


xmatchA sub (Var v,e) = concat [unify sub (unitSub v e)] 
xmatchA sub (Con kl esl,Compose [Con k2 es2]) 

| ki==k2 = xmatches sub (zip esi es2) 
xmatchA _ = [] 


如 果 引 入 : 


extend sub V e = concat [unify sub (unitSub v el)] 
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则 容易 导出 : 


extend sub Vv e 
= case lookup Vv sub of 
Nothing -> [(v,e):sub] 
Just e' -> if e==e' then [sub] 
else [] 


这 里 没有 复杂 的 相 容 性 测试 ， 也 没有 两 个 代 换 的 通用 并 。 如 上 所 承诺 的 ， 只 有 代 换 与 
单位 代 换 的 合 一 。 

处 理 好 xmatcha 后 ， 下 面 集中 处 理 4 个 函数 中 的 其 他 3 个 。 就 像 用 xmatches 定义 
xmatchA 一样 ，xmatch 可 以 用 xmatchesA 定义 。 特 别 地 ， 想 证 明 ， 


xmatch s = cmap (xmatchesA s) . alignments 


> 人 

下 面 是 需要 的 定律 : 

defn match: match = cmap matchesA . alignments 
defn xmatch: xmatch 8 = cmap (unify s) . match 


defn xmatchesA: xmatchesA s = cmap (unify s) . matchesA 
cmap after cmap: cmap f . cmap g = cmap (cmap f . g) 


最 后 一 个 纯粹 的 组 合 定律 是 新 的 ， 定 律 的 验证 留 作 练习 。 计 算 天 生成 下 列 计算 : 


xmatch s 
= {defn xmatch} 
cmap (unify s) . match 
= {defn match} 
cmap (unify s) . cmap matchesA . alignments 
= {cmap after cmap} 
cmap (cmap (unify 8) . matchesA) . alignments 
= {defn xmatchesA} 
cmap (xmatchesA s) . alignments 


到 目前 为 止 , 一 切 顺利 。 现 在 4 个 函数 中 还 有 两 个 没有 定义 ， 即 xmatches 和 xmat- 
chesA。 我 们 希望 每 个 函数 得 到 一 个 递归 定义 ,而 且 不 涉及 unify。 这 两 个 函数 的 定义 
及 其 相像 ， 很 有 可 能 任何 一 个 函数 的 计算 可 立即 用 于 另 一 个 函数 。 当 然 ， 这 种 元 计算 思想 
是 这 种 计算 需 不 可 及 的 。 

现在 集中 注意 力 于 xmatchesA。 首 先 将 xmatchesa 转换 为 点 自由 式 ， 删 除 上 面 定 
义 中 的 参数 s。 修 改 后 的 定义 是 : 


xmatchesA :: (Subst,[(Atom,Expr)]) -> Subst 
xmatchesA = cup . (one * matchesA) 
cup = cmap unify . cpp 


其 中 组 合子 子 定义 为 : 
CPP ‘(XSY8) = L(x,y) | x < E8y y <- YS] 
因此 ， 有 


xmatchesA (sub,aes) 
= cup ([sub] ,aes) 
= concat [unify (s,ae) | s <- [sub] ,ae <- matchesA aes] 
= concat [unify (sub,ae) | ae <- matchesA aes] 


除了 假定 unify 现在 是 非 卡 瑞 函数 外 ， 这 是 xmatchesA 定义 的 忠实 点 自由 式 翻 译 。 
新 的 图 数 cup 具有 类 型 [Subst] -> [Sbust] -> [Subst]。 后 面 将 说 明 cup 满 
足 结合 律 ， 这 是 unify 永远 不 会 具有 的 性 质 (为 什么 不 会 ?) 。 如 在 第 7 章 所 述 ， 累 积 参 
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数 技术 需要 所 关心 的 运算 具有 结合 性 。 
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首先 需要 检查 对 于 新 的 定义 ， 前 面 的 计算 仍然 是 正确 的 。 假 定 给 出 下 面 定 律 : 


defn match: match = cmap matchesA . alignments 
defn xmatch: xmatch = cup . (one * match) 
defn xmatchesA: xmatchesA = cup . (one * matchesA) 
计算 需 便 可 生成 
xmatch 


= {defn xmatch} 

cup . (one * match) 
{defn match} 

cup . (one * (cmap matchesA . alignments)) 

= FT 

cmap (cup . (one * matchesA)) . cpp . (one * alignments) 
{defn xmatchesA} 

cmap xmatchesA . cpp . (one * alignments) 


啊 ， 计 算 通 不 过 。 细 看 计算 中 的 缺口 ， 似 乎 既 需 要 * 的 双 函 子 律 ， 也 需要 关于 cmap 


和 cup 的 下 面 断言 : 


cross bifunctor: (f * g) . (h * k) = (f . h) * (g . k) 
cmap-cup: cmap (cup . (one * &)) . cpp = cup . (id * cmap 区 ) 


现在 计算 帮 很 满意 ， 给 出 下 列 计算 : 


xmatch 
= {defn xmatch} 
cup . (one * match) 
= {defn match} 
cup . (one * (cmap matchesA . alignments)) 
= {cross bifunctor} 
cup . (id * cmap matchesA) . (one * alignments) 
= {cmap-cup} 
cmap (cup . (one * matchesA)) . cpp . (one * alignments) 
= {defn xmatchesA} 


cmap xmatchesA . cpp . (one * alignments) 


接 下 来 需要 考虑 刚才 的 断言 ， 除 了 它 让 计算 器 给 出 期 望 的 结果 外 ， 没 有 其 他 理由 支持 
其 正确 性 。 但 是 ， 可 以 使 用 另 一 个 并 非特 定 于 匹配 的 定律 ， 让 计算 器 证 明 断 言 。 这 个 证 明 


留 作 习 题 M。 定 义 男 外 两 个 定律 : 


defn cup: cup = cmap unify . cpp 
cmap-cpp: cmap (cpp . (one * f)) . cpp = cpp . (id * cmap f£) 


然后 计算 大 生成 下 列 计算 : 


cmap (cup . (one * g)) . cpp 
= {defn cup} 

cmap (cmap unify . cpp . (one * g)) . cpp 
= {cmap after cmap} 

cmap unify . cmap (cpp . (one * g)) . cpp 
= {cmap-cpp} 

cmap unify . cpp . (id * cmap g) 
= {defn cup} 

cup . (id * cmap g) 


现在 可 以 了 。 看 起 来 cmap-cup 定律 是 正确 的 ， 而 且 今 后 还 会 用 到 这 个 定律 。 现 在 回 


到 主要 任务 ， 即 将 xmatchesA 递归 地 用 下 列 形式 的 两 个 等 式 表 示 : 


xmatchesA . (id * nil) = ... 
xmatchesA . (id * cons) = ... 


希望 这 种 定义 不 涉及 Uni fy 0 
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为 了 达到 这 个 目的 ， 还 不 清楚 需要 什么 样 的 定律 。 下 面 将 写 出 想到 的 可 能 有 用 的 定 


律 。 第 一 组 由 4 个 主要 定义 构成 : 

defn match : match = cmap matchesA . 
defn matchesA: matchesA = combine . map matchA 
defn xmatch: xmatch = cup . (one * match) 
defn xmatchesA: xmatchesA = cup . (one * matchesA) 
defn xmatchA: xmatchA = cup . (one * matchA) 
defn combine: combine = cmap unifyAll . cp 


第 二 组 是 关于 cmap 的 一 些 新 定律 : 


cmap after map: cmap f . map g = cmap (f . 8g) 
cmap after concat: cmap f . concat = cmap (cmap f) 
cmap after nil: cmap f .nil = mil 

cmap after one: cmap f . one = ff 


第 三 组 是 关于 map 的 一 些 新 定律 : 


map after nil: map f . Dil = nil 
map after one: map f . one = one .ff 
map after cons: map f . cons = cons . 


alignments 


(f * map f£) 


map after concat: map f . concat = concat . map (map £) 
第 四 组 是 关于 cup 的 定律 : 
cup assoc: cup . (id * cup) = cup . (cup * id) . assocl 


. nil)) = £f . fst 
. nil) * g) = g& . snd 


cup ident: cup . (f * (one 
cup ident: cup . ((one 


assocl: assocl. (f * (g * h)) = ((f * g) * h) . assocl 
最 后 ， 加 上 下 列 定义 和 定律 : 
cross bifunctor: (f * g) . (h* k) = (f . h) * (g . k) 


cross bifunctor: (id * id) = id 

defn cp: cp . nil = one . nil 

defn cp: cp . cons = map cons . cpp . (id * cp) 

defn unifyAll: unifyAll . nil = one . nil 

defn unifyAll: unifyAll . cons = cup . (one * unifyAll) 
unify after nil: unify . (id * nil) = one . fst 
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以 上 总 共 列 出 了 30 个 定律 (包括 没有 重复 列 出 的 定律 map 的 2 个 男子 律 和 cmap 


的 3 个 定律 )。 下 面 祈祷 并 希望 : 


xmatchesA . (id * nil) 

{defn xmatchesA} 
cup . (one * matchesA) . 
= {cross bifunctor} 

cup . (one * (matchesA . nil)) 
= {defn matchesA} 

cup . (one * (combine 
= {map after nil} 

cup . (one * (combine . nil)) 
= {defn combine} 

cup . (one * (cmap unifyAll . cp . nil)) 
= {defn cp} 

cup . (one * (cmap unifyAll . one . nil)) 
= {cmap after one} 

cup . (one * (unifyAll . nil)) 
= {defn unifyAll} 

cup . (one * (one . nil)) 
= {cup ident} 

one . fst 


(id * nil) 


. map matchA . nil)) 


结果 令 人 满意 。 前 面 已 经 证 明了 xmatchesA sub [] 
容易 建立 起 来 。 为 此 ， 必 须 猜 想 结果 ， 并 设法 证 明 。 下 面 是 期 望 的 结果 ， 首 先 用 点 式 表 


示 ， 然 后 用 点 自由 式 表 示 : 


[sub]。 但 是 ,递归 情况 不 
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xmatchesA sub (ae:aes) 


= concat [xmatchesA Sub! aes | sub' <- xmatchA sub ae] 


xmatchesA . (id * cons) 
= cmap xmatchesA . cpp . (xmatchA * one) . assocl 


可 以 对 右 式 进行 简化 〈 暂 时 从 laws2 中 去 掉 xmatchA 和 matchesa 的 定义 ): 


cmap xmatchesA . cpp . (xmatchA * one) . assocl 
= {defn xmatchesA} 
cmap (cup . (one * matchesA)) . cpp . (xmatchA * one) . assocl 
= {cmap-cup} 
cup . (id * cmap matchesA) . (xmatchA * one) . assocl 
= {cross bifunctor} 
cup . (xmatchA * (cmap matchesA . one)) . assocl 
= {cmap after one} 
cup . (xmatchA * matchesA) . assocl 


现在 希望 证 明 : 


xmatchesA . (id * cons) 
= cup . (xmatchA * matchesA) . assocl 


但 是 ,不幸 的 是 计算 做 做 不 到 这 点 。 缺 口 在 这 里 : 


cup . ((cup . (one * matchA)) * matchesA) 


cup . (one * (cup . (matchA * matchesA))) . assocl 


这 个 缺口 很 容易 手动 消除 : 


cup . ((cup . (one * matchA)) * matchesA) 
= {cross bifunctor (backwards)} 

cup . (cup * id) . ((one * matchA) * matchesA) 
= {cup assoc} 

cup . (id * cup) . assocl . ((one * matchA) * matchesA) 
= {assocl} 

cup . (id * cup) . (one * (matchA * matchesA)) . assocl 
= {cross bifunctor} 

cup . (one * (cup . (matchA * matchesA))) . assocl 


又 一 次 看 到 ， 不 能 双向 应 用 定律 是 问题 的 起 因 。 在 这 里 加 上 了 注释 “手工 完成 的 作 
品 !”， 而 没有 设法 强迫 定律 写成 计算 货 可 以 接受 的 形式 。 
为 了 结束 这 个 例子 ， 下 面 给 出 计算 出 的 程序 : 


match = xmatch emptySub 
xmatch sub (el ,e2) 
= concat [xmatchesA sub aes | aes <- alignments (el,e2)] 
xmatchesA sub [] = [sub] 
xmatchesA sub (ae:aes) 
= concat [xmatchesA sub' aes | sub' <- xmatchA sub ae] 


xmatchA sub (Var Vv,e) = extend sub ve 
xmatchA sub (Con ki esi,Compose [Con k2 es2]) 

| ki==k2 = xmatches sub (zip esl es2) 
xmatchA _ = [] 


缺席 的 定义 是 xmatches。 不 过 ， 处 理 xmatchesa 的 过 程 完 全 适用 于 处 理 mat- 
ches， 最 后 得 到 


xmatches sub [] = [sub] 
xmatches sub ((el,e2) :es) 
= concat [xmatches sub' es | sub' <- xmatch sub (el,e2)] 
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结论 


这 两 个 练习 的 正面 结论 是 ， 计 算 器 确实 可 以 用 来 辅助 构建 形式 证 明 。 但 是 ， 在 这 个 过 
程 中 需要 大 量 的 人 工 输入 ,设置 合适 的 定律 ， 识 别 辅助 断言 和 控制 计算 进行 的 次 序 。 主 要 
的 负面 结论 是 ， 计 算 器 不 能 双向 应 用 定律 是 一 个 大 的 缺陷 。 郴 子 律 是 问题 的 主要 来 源 ， 但 
是 其 他 定律 也 有 类 似 问 题 (参见 习题 中 的 例子 ) 。 计 算 髓 可 以 从 几 个 方面 改进 ， 但 是 进 一 
步 改 进 讨论 将 放 在 习题 中 。 

关于 这 个 计算 器 还 有 3 个 方面 值得 提出 。 第 一 ， 完 整 的 计算 器 只 有 450 行 Haskell 代 
码 ， 改 进 的 版 本 更 短 。 仪 这 一 点 已 经 证 明了 函数 式 程序 设计 的 表达 能 力 。 第 二 ， 将 定律 表 
达 为 纯 函 数 等 式 ， 然 后 使 用 等 式 逻 辑 做 证 明 似 乎 是 切实 可 行 的 方法 。 为 此 ， 必 须 花 些 时 间 
将 定义 表达 成 点 自由 形式 ， 但是， 一 旦 这 个 工作 完成 ， 等 式 逻 辑 计 算 变 得 非常 高 效 。 

第 三 ， 除 语法 分 析 外 ， 单 子 没有 出 现在 计算 器 中 。 实 际 上 ， 计算 右 较 早 的 版 本 确实 使 
用 了 单子 ， 但 是 ， 它 们 渐渐 被 淘汰 了 。 一 个 原因 是 ， 我 们 发 现 没 有 单子 的 代码 更 简单 ， 效 
率 也 没有 很 大 的 损失 ; 另 一 个 原因 是 我 们 想 为 习题 中 计算 器 的 改进 留 出 空间 。 单 子 对 于 涉 
及 与 外 界 交互 的 许多 应 用 是 绝对 必要 的 ， 但 是 在 纯 函 数 方式 已 经 很 有 效 时 ， 单 子 的 使 用 可 
能 变 得 多 余 。 

用 以 上 几 点 结论 结束 本 章 。 


12.9 习题 


习题 A ”假如 我 们 想 让 calculate 返回 所 有 可 能 计算 构成 的 树 。 使 用 什么 样 的 树 合适 ? 
习题 B 为 什么 下 列 定律 永远 不 被 使 用 ， 人 至 少 如 果 定 律 用 下 列 形式 给 出 的 话 ? 
map (f . g) = mapf .mapg 
cmap (f . g) = cmap f . map g 
习题 C ”以 下 是 计算 各 给 出 的 一 个 计算 : 
map f . map gh 
= {map functor} 
map (f . g) 
请 解释 这 种 奇怪 、 明 显 没 意 义 的 结果 。 对 计算 需 做 怎样 的 简单 改动 可 以 避免 这 种 不 合 
理 计算 的 问题 ? 
习题 D 与 习题 C 类 似 的 问题 ， 对 于 计算 画 的 严肃 批评 指出 ， 错 误 信 息 是 完全 不 透明 
的 。 例 如 : 


parse law "map f . map g = map (f . g)" 
parse law "map functor: map f . map g map (f . g)" 


这 两 个 计算 都 引发 神秘 的 错误 信息 。 请 问 是 什么 错误 信息 ?在 一 个 计算 中 使 用 下 列 定律 的 
效果 是 什么 ? 

strange: map f . map g = maph 

同样 ， 如 何 修 改 计 算 如 使 其 避免 接受 这 种 定律 ? 

习题 E 原子 的 showsPrec 定义 使 用 了 之 前 没有 用 到 的 Haskell 的 一 个 事实 。 同 样 的 
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机 制 后 来 在 计算 器 的 混合 模式 匹配 与 条 件 等 式 的 函数 中 用 到 。 这 种 机 制 是 什么 ? 

习题 FF 定义: 

el = foo (f .gg) .8g 

e2 = bar f . bazg 

请 列 出 当 rewrites (el,e2) 应 用 于 表达 式 foo (a . b . c) .cc 时 所 生成 的 表达 
式 。 请 问 计 算 遂 会 选择 哪 一 个 ? 

习题 G ”计算 器 能 够 成 功 地 将 foo f . foo f 与 下 列表 达 式 匹配 吗 ? 


foo (bar g h) . foo (bar (daz a) b) ? 


习题 H 书 中 曾 称 这 是 可 能 的 : 应 用 一 个 完全 合法 的 非 平凡 定律 将 使 得 某 些 表达 式 不 
变 。 请 给 出 一 个 这 样 的 定律 和 一 个 表达 式 ， 将 定律 应 用 于 表达 式 重 写成 目 身 。 

习题 | 书 中 rewrites 定义 中 的 函数 anyone 设置 单个 选择 ， 但 是 为 什么 不 使 用 
everyOne 同 时 设置 每 一 个 选择 ? 因此 ,如果 f1 = [-1,，-2],fEf2 = [-3，-4]， 
那么 


everyDne 2 [ ,2] Ll=i=3] 3 【和 ,一 人] 3 [2,-3] 》 [-3,-4]] 


使 用 everyone 而 不 是 anyone 意味 着 每 个 重 写 将 被 应 用 于 匹配 一 个 定律 的 每 个 可 
能 的 表达 式 。 请 给 出 everyOne 的 定义 。 

习题 」 长 度 为 n 的 列表 有 多 少 个 段 ? rewritesSegqg 的 定义 是 低 效 的 ， 因 为 在 长 度 
为 n 的 列表 的 分 段 中 ， 空 段 作为 中 间 分 段 出 现 n+1 次 。 这 表示 与 ia 的 匹配 进行 了 n+1 
次 ， 而 不 是 一 次 。 如 何 重 写 segments 来 消除 这 些 重复 工作 ? 

习题 K 证 明 cmap f . cmap g = cmap (cmap f . g)。 需 要 的 定律 如 下 : 


defn cmap: cmap f = concat . map 工 


map functor: map f . map g = map (f.g) 
map after concat: map f . concat = concat . map (map f£) 
concat twice: concat . concat = concat . map concat 


习题 L 定律 cmap-cpp 如 下 : 


cmap (cpp . (one * f)) . cpp = cpp . (id * cmap 工 ) 


请 利用 下 列 定 律 证 明 cmap- cpp。 

cmap after cmap: cmap f . map g = cmap (f . g) 

cmap after cpp: cmap cpp . cpp = cpp . (concat * concat) 
cross bifunctor: (f * g) . (h* k) = (f . h) * (g . k) 

map after cpp: map (f * g) . cpp = cpp . (map f * map g&) 
defn cmap: cmap f = Concat . map f 

concat after id: concat . map one = id 


计算 器 能 够 完成 这 个 证 明 吗 ? 


12. 10 ”答案 
习题 A 答案 用 表达 式 作为 结 点 的 标记 ， 定 律 名 作为 边 的 标记 。 由 此 得 到 


type Calculation = Tree Expr LawName 
data Tree ab = Node a [(b,Tree a b)] 


习题 B 答案 ”这样 会 使 得 计算 禹 陷入 无 穷 计算 。 例 如 : 
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map foo 
= {map functor} 
map foo . map id 
= {map functor} 
map foo . map id . map id 


等 等 。 

习题 C 答案 ”根据 语法 规则 ， 表 达 式 map f . map gh 是 完全 合法 的 ， 但是， 当然 不 
应 该 。 计 算 需 不 会 限制 每 个 贡 量 和 同一 个 常量 的 每 次 出 现 都 具有 相同 个 数 的 参数 。 函 子 律 
可 以 成 功 匹配 该 表达 式 的 原因 是 ,在 matcha 的 定义 中 ， 函 数 zip 将 第 二 个 map 的 两 个 
参数 截 短 为 一 个 。 一 个 更 好 的 计算 顺应 该 检查 每 个 常量 具有 固定 数目 的 参数 。 

习题 D 答案 ”神秘 的 信息 是 “ 空 列表 的 第 一 个 元 素 ”。 第 一 个 分 析 失 败 ， 因 为 定律 缺 
少 名 ， 第 二 个 缺少 等 号 。 使 用 奇怪 的 定律 将 引发 计算 顺产 生 错误 信息 ， 因 为 与 左边 模式 匹 
配 后 nh 没有 绑 定 任何 表达 式 ， 当 系统 需要 jh 的 绑 定 值 时 引起 错误 。 为 了 避免 这 种 问题 ， 计 
算 融 应 该 检查 一 个 定律 右边 的 每 个 变量 都 在 左边 出 现 。 

习题 E 答案 showsPrec 的 定义 如 下 : 


showsPrec p (Con f [el,e2]) 

| isOp f = expressionl el e2 
showsPrec p (Con f es) 

= expression2 es 


一 个 更 数学 化 的 定义 是 


showsPrec p (Con f [el,e2]) 
| isOp f£ = expressioni el e2 
| otherwise = expression2 [el ,e2] 


showsPrec p (Con f es) = expression2 es 


要 点 是 ， 在 一 个 子 名 中， 如 果 模 式 与 参数 不 匹配 ， 或 者 模式 与 参数 匹配 ,但 是 条 件 不 成 
立 ， 则 本 子 句 被 禁止 ， 继 续 选 择 后 面 的 子 句 。 
习题 F 答案 有 了 两 个 重 写 ， 不 是 一 个 : 


bax ta ., Bb: . &) . baz id .. & 
bar ‘(a »; b) » baz c 


计算 天 将 选择 匹配 的 第 一 个 子 表达 式 ， 这 也 表示 第 一 个 重 写 被 选中 。 或 者 更 好 的 方法 
是 让 rewritesSeg 先 应 用 于 长 段 ， 后 应 用 于 较 短 的 段 。 

习题 G 答案 不 能 ， 用 给 出 的 match 定义 不 行 。 只 有 当 g 绑 定 aaz a, h 绑 定 bb 
时 , 将 王 绑 定 表达 式 bar (daz a) b 可 以 匹配 ,但 是 给 出 的 match 定义 不 能 进行 完全 
人 和. 


习题 H 答案 有 许多 例子 ， 这 里 只 是 一 个 例子 。 考 虑 下 列 定律 


i pee hl mB. te, 芭 


左边 匹配 if a b c， 其 中 绑 定 ia， 而 且 绪 末 还 是 同一 个 表达 式 。 
习题 | 答案 ”可 能 的 诱惑 是 定义 : 


eVeryUne f = cp . mapf 


但 是 ， 如 果 f£ 不 返回 任何 选择 ， 则 该 定义 不 可 行 。 必 须 定 义 : 
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every0ne :: (a -> [al]l) -> [a] -> [[a]] 

every0ne f = cp . map (possibly f£) 

possibly f x = if null xs then [x] else xs 
Where XS = fx 


在 这 个 定义 中 ，f 返回 选择 的 非 空 列表 。 
习题 J 答案 ”长度 为 n 的 列表 有 (n+1)(n+2)/2 个 段 。 改 进 的 定义 如 下 : 


segments xs = [([],[],xs] ++ 
[(as,bs, cs) 
| (as,ys) <- splits xs, 
(bs,cs) <- tail (splits ys)] 


习题 K 答案 ”计算 遂 输 出 : 


cmap f . cmap 区 
{defn cmap} 
concat . map f . cmap & 
= {defn cmap} 
concat . map f . concat . map 上 多 
= {map after concat} 
concat . concat . map (map f) . map & 
= {map functor} 
concat . concat . map (map f . g&) 
= {concat after concat} 
concat . map concat . map (map f . g) 
= {map functor} 
concat . map (concat . map f . g) 
= {defn cmap} 
concat . map (cmap f . g) 
= {defn cmap} 
cmap (cmap f . g) 


习题 上 答案 人 工 证 明 如 下 : 


cmap (cpp . (one * g)) . cpp 
= {cmap after cmap (backwards)} 
cmap cpp . map (one * g) . cpp 
= {map after cpp} 
cmap cpp . cpp . (map one * map g) 
= {cmap after cpp} 
CPP . (concat * concat) . (map one * map £) 
= {cross bifunctor} 
cpp . ((concat . map one) * concat (map £)) 
= {defn cmap (backwards)} 
cpp . ((concat . map one) * cmap g) 
{concat after id} 
cpp . (id * cmap g) 


不 能 ， 这 个 计算 不 能 自动 完成 。 定律 cmap after cmap 反 回 写 会 引起 计算 筑 陷 人 循 
环 ( 见 习题 B)。 


12. 11 注 记 


3 本 章 的 计算 器 基于 我 的 牛津 同事 Mike Spivey 未 公开 的 一 个 定理 证 明 船 。 伦 敦 城市 大 
! | 学 的 Ross Paterson 设计 了 具有 内 置 的 可 以 双 回 应 用 的 图 子 定律 的 版 本 。 
3 一 个 最 先进 的 证 明 辅 助 器 是 Coq， 参 见 http :coq. inria. fr/。 
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paper-rock-scissors (石头 -前 刀 - 布 ) ，221 
paragraphs (段落 ) ，191 
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